[FUG-BR] [OT] Cacti

Quarta Fevereiro 13 18:26:56 BRST 2008

Gustavo Fukao escreveu:
> On Feb 12, 2008 12:02 PM, Patrick Tracanelli
> <eksffa em freebsdbrasil.com.br> wrote:
>> Gustavo Fukao escreveu:
>>> Pessoal,
>>>
>>> Estou utilizando o Cacti para monitoramento SNMP ....  so que estou
>>> precisando que me enviasse e-mail quando um servico parasse ....
>>>
>>> Achei um plugin (Thold) para enviar e-mail qdo a maquina mudasse de
>>> estado, mas estou procurando alerta para servicos.
>>>
>>> Achei tambem templates utilizando smokeping e advanced ping, mas ambos
>>> para geracao de graficos......
>> Cara o thold alerta, mas teoricamente voce tem que por o alerta por
>> threshold criado. É esse o caminho, se voce quer monitorar servico por
>> servico.
>>
>> Porem, se voce quer monitorar disponibilidade geral use o plugin
>> Monitor. Nesse caso ele so alerta quando a maquina para (leia-se, o SNMP)
>>
>> --
>> Patrick Tracanelli
>>
>> FreeBSD Brasil LTDA.
>> Tel.: (31) 3516-0800
>> 316601 em sip.freebsdbrasil.com.br
>> http://www.freebsdbrasil.com.br
>> "Long live Hanin Elias, Kim Deal!"
>>
>>
>> -------------------------
>> Histórico: http://www.fug.com.br/historico/html/freebsd/
>> Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
>>
> 
> Tem algum template (advanced ping / smoke ping / outro ) que vc esteja
> monitorando ????

Fukao, não tem não. Tudo que eu preciso monitorar o faço por SNMP, pois 
ter os gráficos é fundamental nesse ambiente. Se o ambiente é mais 
simples e requer apenas monitoramento de disponibilidade de serviços (e 
não métricas de qualidade) uso apenas Nagios. Mas no caso como monitoro 
tudo, crio os thresholds pelo Thold pros perfis de grafico. Não tem como 
ser mais simples e completo.

Assim, eu gero alertas de vários tipos. Exemplo de um tipo de 
monitoracao, Squid. Se o Squid cair, alerta (obviamente), mas se o squid 
passar a atender pouquissimos hits no grafico de 5 minutos, abaixo do 
que eu considero a métrica mínima de eficiencia, alerta tambem. Se a 
porcentagem de HIT do squid ficar muito baixa, alerta. Se a de MISS 
ficar muito alta, alerta também. Se o número de requisições ficar acima 
de 10% do máximo aceitável na métrica de qualidade da empresa, alerta 
também.

Outros exemplos mais bacanas, de monitoramento de serviços que não ouvem 
na rede. Por exemplo, um sistema de automação de forno industrial, que 
roda em Windows. Como monitorar sua atividade? Simples, pelo consumo de 
memória. Se consome memória ta ativo. Se por algum momento o consumo 
retornar 0 ou "nan" no Cacti, é porque o serviço morreu. Ai alerta. Se 
ele consumir mais memória do que o máximo usual, alerta também. Se ele 
consumir mais CPU do que o máximo aceitável, alerta também.

Enfim, pra empresas sérias, monitorar apenas disponibilidade é pouco. 
Métricas de qualidade são fundamentais, principalmente se o SLA 
contratualmente oferecer garantias. Ai mais do que avisar ter historico 
grafico é fundamental. Mas bla-bla-bla a parte o mais bacana é a 
facilidade.

Mas repito, se eu quero monitorar apenas "servico caiu, servico voltou", 
ai uso Nagios.

-- 
Patrick Tracanelli

FreeBSD Brasil LTDA.
Tel.: (31) 3516-0800
316601 em sip.freebsdbrasil.com.br
http://www.freebsdbrasil.com.br
"Long live Hanin Elias, Kim Deal!"