Habilidades

Observabilidade

Monitoramento, métricas, alertas e dashboards de infraestrutura

// ferramentas

Ferramentas

📊
Zabbix
Monitoramento · Alertas

Plataforma de monitoramento enterprise open source. Utilizada para monitorar servidores, switches, roteadores e serviços com coleta via agente, SNMP, JMX e IPMI.

Monitoramento de hosts, serviços e redes via agente e SNMP
Criação de templates, triggers e ações automáticas
Topologia visual de rede com mapas interativos
Alertas via e-mail, Telegram e integrações webhook
Discovery automático de dispositivos
SNMPAgenteTemplates LLDMapasAPI
📈
Grafana
Dashboards · Visualização

Plataforma de visualização de métricas e dados. Criação de dashboards interativos conectando múltiplas fontes — Prometheus, Zabbix, InfluxDB, MySQL e mais.

Dashboards personalizados com painéis gráficos, tabelas e gauges
Integração com Prometheus, InfluxDB, Loki e Zabbix
Alertas nativos e notificações multi-canal
Variáveis dinâmicas e filtros interativos
DashboardsPrometheus InfluxDBLokiAlertas
🔥
Prometheus
Métricas · Time Series

Sistema de monitoramento e banco de dados de séries temporais. Coleta métricas via scraping HTTP, com linguagem de consulta PromQL e integração nativa com Grafana.

Coleta de métricas via exporters (Node, cAdvisor, Blackbox)
Consultas com PromQL para análise de dados
Alertmanager para roteamento de alertas
Service discovery via Kubernetes, Docker e arquivos
PromQLExportersAlertmanager ScrapingTSDB
🗺️
LibreNMS
Descoberta · Topologia

Plataforma de monitoramento de rede com descoberta automática via SNMP. Suporte a centenas de fabricantes, gráficos de tráfego e alertas integrados.

Discovery automático de dispositivos via SNMP
Gráficos de tráfego de interface por RRDtool
Suporte a Huawei, Cisco, Mikrotik, Juniper e mais
Alertas configuráveis com regras flexíveis
SNMPAuto-discovery RRDtoolMulti-vendor
🛡️
PRTG
Monitoramento · All-in-One

Solução de monitoramento completa para ambientes Windows e corporativos. Interface intuitiva, sensores pré-configurados e mapas de rede automáticos.

Sensores para SNMP, WMI, HTTP, ping, flow e mais
Mapas de rede automáticos e dashboards visuais
Notificações por e-mail, SMS e push
Relatórios agendados e histórico de disponibilidade
SNMPWMINetFlow SensoresRelatórios
// pilares

Os 3 Pilares da Observabilidade

📉
Métricas
Dados numéricos ao longo do tempo — CPU, memória, largura de banda, latência. Base para alertas e capacity planning.
📋
Logs
Registros de eventos e erros dos sistemas. Essenciais para diagnóstico de falhas, auditoria e troubleshooting.
🔍
Traces
Rastreamento de requisições entre serviços. Permite identificar gargalos e latências em ambientes distribuídos.
🚨
Alertas
Notificações proativas baseadas em thresholds e anomalias. Reduz tempo de resposta a incidentes (MTTR).