Observabilidade · Métricas
Métricas que impulsionam
decisões
Convertemos sinais técnicos em conhecimento de negócio. Prometheus, Grafana e VictoriaMetrics geridos como serviço, com SLOs definidos em conjunto com as suas equipas e dashboards que qualquer pessoa da organização compreende.
A nossa abordagem
Três pilares da nossa prática de métricas
Cada organização necessita de ver o estado da sua plataforma a partir de três ângulos distintos: negócio, serviço e operações.
Métricas de Negócio
Taxa de conversão, tempo de checkout, disponibilidade de API pública. Instrumentamos os seus serviços para que as métricas falem a linguagem do seu negócio, não apenas dos seus sistemas.
- KPIs ligados a receitas e retenção
- Instrumentação com OpenMetrics
- Agregações por domínio de negócio
SLIs / SLOs
Definimos em conjunto com a sua equipa os indicadores de nível de serviço e os objectivos que protegem a experiência do utilizador final. Error budgets que equilibram velocidade de entrega com estabilidade.
- Workshop de definição de SLOs
- Error budgets e alertas de burn-rate
- Integração com alertmanager
Dashboards Executivos
Painéis concebidos para que a sua direcção técnica e de negócio tome decisões com confiança. Grafana como plataforma unificada de visualização com controlo de acesso por papel.
- Design centrado na audiência
- Hierarquia de vistas (C-Level a SRE)
- Exportação para PDF e Slack
Stack tecnológico
Plataformas com que trabalhamos
Tecnologia open-source de primeiro nível, combinada com critério. Sem vendor lock-in, sem licenças desnecessárias.
Porquê Prometheus + VictoriaMetrics?
O Prometheus lidera o scraping e a definição de alertas. O VictoriaMetrics escala o armazenamento de longo prazo com até 10x melhor relação desempenho/custo face ao TSDB nativo. O Thanos acrescenta alta disponibilidade e consultas globais em ambientes multicluster.
Grafana como camada de visualização universal
Um único painel que liga ao Prometheus, VictoriaMetrics, InfluxDB, Elasticsearch e mais de 50 fontes de dados. Dashboards como código (Grafonnet/JSON) sob controlo de versões, implementados automaticamente por CI/CD.
Metodologia
Como o fazemos
Um processo iterativo e colaborativo que garante que o que medimos é realmente o que importa.
Descoberta e mapeamento
Auditamos os serviços existentes, identificamos o que já se mede e o que falta. Definimos o mapa de métricas críticas em conjunto com Product Owners e engenheiros.
Instrumentação e implementação
Instrumentamos o código, implementamos exporters e configuramos scrapers. Tudo como código (Helm Charts, Terraform) com validação automatizada em pipeline.
Dashboards, alertas e transferência
Construímos os dashboards, afinamos as regras de alertas para eliminar ruído, e formamos a sua equipa para que possa evoluir a plataforma de forma autónoma.
Pronto para medir o que importa?
Os seus dashboards dizem a verdade?
Desenhamos painéis que os seus engenheiros vão querer usar e que os seus directores vão entender ao instante. Sem ruído, sem dados irrelevantes.