Início Rápido

Instale, instrumente, valide e rode Obtrace em produção em menos de 30 minutos

Este guia é intencionalmente opinativo: ele entrega o caminho mais curto para valor real em produção, não apenas uma demo local.

Ao final, você terá:

Um serviço backend instrumentado e enviando dados.
Instrumentação opcional de frontend ligada ao mesmo modelo de contexto.
Contexto de runtime e CI/CD disponível na investigação.
Interfaces prontas para IA (Ask AI, llm.txt, mcp.json).

Pré-requisitos

Conta Obtrace com chave de API.
Acesso a um serviço relevante de produção.
Acesso à configuração de deploy (env vars/secrets).
Acesso ao pipeline de CI/CD (recomendado para correlação com release).

Como Saber se Deu Certo

Antes de começar, defina critérios de aceite:

Telemetria chega continuamente para o serviço alvo.
Você consegue filtrar por service, env e version sem ambiguidade.
Pelo menos um erro/trace tem contexto suficiente para diagnóstico.
Picos de telemetria podem ser associados a release/deploy.

Passo 1: Configure Autenticação Corretamente

Siga Autenticação e crie credenciais por ambiente.

Estratégia recomendada de chaves:

Uma chave por ambiente (dev, staging, prod).
Opcionalmente, uma por serviço para reduzir blast radius.
Chaves privilegiadas apenas no servidor.

Passo 2: Instrumente Primeiro o Serviço Backend Mais Crítico

Escolha o serviço com maior risco operacional (checkout, auth, billing, API gateway).

Selecione runtime no Catálogo de SDKs.
Instale e inicialize SDK.
Adicione atributos canônicos em todo evento/span:
- service
- env
- version
- region (se multi-região)

Essa ordem gera maior valor diagnóstico por minuto investido.

Passo 3: Adicione Instrumentação de Frontend (Se Impacto no Usuário For Relevante)

Use SDK JavaScript Browser.
Capture contexto de página/rota/interação quando fizer sentido.
Correlacione falhas de frontend com requisições backend.

Isso transforma “backend lento” em “qual fluxo de usuário degradou e por quê”.

Passo 4: Valide Ingestão e Qualidade dos Dados

Não avance rollout sem passar nesse gate.

Checklist de validação:

Fluxo contínuo, sem comportamento muito em rajadas.
Timestamps corretos (sem drift severo).
Sampling intencional e documentado.
Sem frequência alta de 401/403 ou retries de transporte.
Tags estáveis e padronizadas.

Passo 5: Adicione Integração de Runtime

Conecte cedo o ambiente real de execução:

Objetivo: contexto do incidente precisa incluir onde a carga rodou.

Passo 6: Anexe Contexto de CI/CD

Integre GitHub Actions para ler telemetria junto com eventos de release.

Campos mínimos de contexto de release:

commit SHA
build ID
timestamp de deploy
ambiente

Sem contexto de release, a análise de causa raiz sempre perde tempo.

Passo 7: Ative Fluxos de IA (Depois do Baseline Limpo)

Use botão flutuante Pergunte à IA nas docs.
Publique contexto legível por máquina em /llm.txt e /mcp.json.
Revise MCP para integração com agentes.

Fluxo de IA só funciona bem com telemetria de qualidade.

Erros Comuns

Começar por serviços demais ao mesmo tempo.
Falta de tags service/env/version.
Reutilizar uma única chave em todos os ambientes.
Rollout sem validar qualidade de ingestão.
Tratar docs como referência passiva em vez de manual operacional.

Próximos Caminhos

Arquitetura e modelo mental: Introdução
Sequência operacional de rollout: Como usar
Critérios por runtime: Matriz de Integrações

Nesta página

Pré-requisitos Como Saber se Deu Certo Passo 1: Configure Autenticação Corretamente Passo 2: Instrumente Primeiro o Serviço Backend Mais Crítico Passo 3: Adicione Instrumentação de Frontend (Se Impacto no Usuário For Relevante)Passo 4: Valide Ingestão e Qualidade dos Dados Passo 5: Adicione Integração de Runtime Passo 6: Anexe Contexto de CI/CD Passo 7: Ative Fluxos de IA (Depois do Baseline Limpo)Erros Comuns Próximos Caminhos