Observabilidade enxuta: logs, métricas e SLOs para equipas pequenas
Observabilidade não é «ligar tudo ao Elastic e esperar o melhor». Para equipas enxutas, o foco é: consegue responder «o sistema está degradado para o utilizador?» em minutos, com dados que já tem.
Logs estruturados (JSON com request id, user id anonimizado quando aplicável) custam pouco no código e poupam horas em produção. Métricas de caixa vermelha — latência p95, taxa de erro, fila de jobs — dão o pulso do serviço sem dashboards infinitos.
Um SLO simples, por exemplo «99% dos pedidos de checkout < 2s em 30 dias», alinha negócio e engenharia. Error budget gasta: priorize fiabilidade; sobra budget: pode investir em features.
Alertas devem acordar alguém com um passo seguinte claro. Se o runbook é «ver amanhã», o alerta é ruído. Comece com poucos, afinados, e expanda quando a dívia de instrumentação estiver paga.
Gostou do tema? Fale connosco sobre o vosso contexto — adaptamos stack e processo ao produto.
← Voltar ao blog