Início Rápido
Instale, instrumente, valide e rode Obtrace em produção em menos de 30 minutos
Este guia é intencionalmente opinativo: ele entrega o caminho mais curto para valor real em produção, não apenas uma demo local.
Ao final, você terá:
- Um serviço backend instrumentado e enviando dados.
- Instrumentação opcional de frontend ligada ao mesmo modelo de contexto.
- Contexto de runtime e CI/CD disponível na investigação.
- Interfaces prontas para IA (
Ask AI,llm.txt,mcp.json).
Pré-requisitos
- Conta Obtrace com chave de API.
- Acesso a um serviço relevante de produção.
- Acesso à configuração de deploy (env vars/secrets).
- Acesso ao pipeline de CI/CD (recomendado para correlação com release).
Como Saber se Deu Certo
Antes de começar, defina critérios de aceite:
- Telemetria chega continuamente para o serviço alvo.
- Você consegue filtrar por
service,enveversionsem ambiguidade. - Pelo menos um erro/trace tem contexto suficiente para diagnóstico.
- Picos de telemetria podem ser associados a release/deploy.
Passo 1: Configure Autenticação Corretamente
Siga Autenticação e crie credenciais por ambiente.
Estratégia recomendada de chaves:
- Uma chave por ambiente (
dev,staging,prod). - Opcionalmente, uma por serviço para reduzir blast radius.
- Chaves privilegiadas apenas no servidor.
Passo 2: Instrumente Primeiro o Serviço Backend Mais Crítico
Escolha o serviço com maior risco operacional (checkout, auth, billing, API gateway).
- Selecione runtime no Catálogo de SDKs.
- Instale e inicialize SDK.
- Adicione atributos canônicos em todo evento/span:
serviceenvversionregion(se multi-região)
Essa ordem gera maior valor diagnóstico por minuto investido.
Passo 3: Adicione Instrumentação de Frontend (Se Impacto no Usuário For Relevante)
- Use SDK JavaScript Browser.
- Capture contexto de página/rota/interação quando fizer sentido.
- Correlacione falhas de frontend com requisições backend.
Isso transforma “backend lento” em “qual fluxo de usuário degradou e por quê”.
Passo 4: Valide Ingestão e Qualidade dos Dados
Não avance rollout sem passar nesse gate.
Checklist de validação:
- Fluxo contínuo, sem comportamento muito em rajadas.
- Timestamps corretos (sem drift severo).
- Sampling intencional e documentado.
- Sem frequência alta de
401/403ou retries de transporte. - Tags estáveis e padronizadas.
Passo 5: Adicione Integração de Runtime
Conecte cedo o ambiente real de execução:
Objetivo: contexto do incidente precisa incluir onde a carga rodou.
Passo 6: Anexe Contexto de CI/CD
Integre GitHub Actions para ler telemetria junto com eventos de release.
Campos mínimos de contexto de release:
- commit SHA
- build ID
- timestamp de deploy
- ambiente
Sem contexto de release, a análise de causa raiz sempre perde tempo.
Passo 7: Ative Fluxos de IA (Depois do Baseline Limpo)
- Use botão flutuante Pergunte à IA nas docs.
- Publique contexto legível por máquina em
/llm.txte/mcp.json. - Revise MCP para integração com agentes.
Fluxo de IA só funciona bem com telemetria de qualidade.
Erros Comuns
- Começar por serviços demais ao mesmo tempo.
- Falta de tags
service/env/version. - Reutilizar uma única chave em todos os ambientes.
- Rollout sem validar qualidade de ingestão.
- Tratar docs como referência passiva em vez de manual operacional.
Próximos Caminhos
- Arquitetura e modelo mental: Introdução
- Sequência operacional de rollout: Como usar
- Critérios por runtime: Matriz de Integrações