[FUG-BR] [OT] Cacti
Patrick Tracanelli
eksffa em freebsdbrasil.com.br
Quarta Fevereiro 13 18:26:56 BRST 2008
Gustavo Fukao escreveu:
> On Feb 12, 2008 12:02 PM, Patrick Tracanelli
> <eksffa em freebsdbrasil.com.br> wrote:
>> Gustavo Fukao escreveu:
>>> Pessoal,
>>>
>>> Estou utilizando o Cacti para monitoramento SNMP .... so que estou
>>> precisando que me enviasse e-mail quando um servico parasse ....
>>>
>>> Achei um plugin (Thold) para enviar e-mail qdo a maquina mudasse de
>>> estado, mas estou procurando alerta para servicos.
>>>
>>> Achei tambem templates utilizando smokeping e advanced ping, mas ambos
>>> para geracao de graficos......
>> Cara o thold alerta, mas teoricamente voce tem que por o alerta por
>> threshold criado. É esse o caminho, se voce quer monitorar servico por
>> servico.
>>
>> Porem, se voce quer monitorar disponibilidade geral use o plugin
>> Monitor. Nesse caso ele so alerta quando a maquina para (leia-se, o SNMP)
>>
>> --
>> Patrick Tracanelli
>>
>> FreeBSD Brasil LTDA.
>> Tel.: (31) 3516-0800
>> 316601 em sip.freebsdbrasil.com.br
>> http://www.freebsdbrasil.com.br
>> "Long live Hanin Elias, Kim Deal!"
>>
>>
>> -------------------------
>> Histórico: http://www.fug.com.br/historico/html/freebsd/
>> Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
>>
>
> Tem algum template (advanced ping / smoke ping / outro ) que vc esteja
> monitorando ????
Fukao, não tem não. Tudo que eu preciso monitorar o faço por SNMP, pois
ter os gráficos é fundamental nesse ambiente. Se o ambiente é mais
simples e requer apenas monitoramento de disponibilidade de serviços (e
não métricas de qualidade) uso apenas Nagios. Mas no caso como monitoro
tudo, crio os thresholds pelo Thold pros perfis de grafico. Não tem como
ser mais simples e completo.
Assim, eu gero alertas de vários tipos. Exemplo de um tipo de
monitoracao, Squid. Se o Squid cair, alerta (obviamente), mas se o squid
passar a atender pouquissimos hits no grafico de 5 minutos, abaixo do
que eu considero a métrica mínima de eficiencia, alerta tambem. Se a
porcentagem de HIT do squid ficar muito baixa, alerta. Se a de MISS
ficar muito alta, alerta também. Se o número de requisições ficar acima
de 10% do máximo aceitável na métrica de qualidade da empresa, alerta
também.
Outros exemplos mais bacanas, de monitoramento de serviços que não ouvem
na rede. Por exemplo, um sistema de automação de forno industrial, que
roda em Windows. Como monitorar sua atividade? Simples, pelo consumo de
memória. Se consome memória ta ativo. Se por algum momento o consumo
retornar 0 ou "nan" no Cacti, é porque o serviço morreu. Ai alerta. Se
ele consumir mais memória do que o máximo usual, alerta também. Se ele
consumir mais CPU do que o máximo aceitável, alerta também.
Enfim, pra empresas sérias, monitorar apenas disponibilidade é pouco.
Métricas de qualidade são fundamentais, principalmente se o SLA
contratualmente oferecer garantias. Ai mais do que avisar ter historico
grafico é fundamental. Mas bla-bla-bla a parte o mais bacana é a
facilidade.
Mas repito, se eu quero monitorar apenas "servico caiu, servico voltou",
ai uso Nagios.
--
Patrick Tracanelli
FreeBSD Brasil LTDA.
Tel.: (31) 3516-0800
316601 em sip.freebsdbrasil.com.br
http://www.freebsdbrasil.com.br
"Long live Hanin Elias, Kim Deal!"
Mais detalhes sobre a lista de discussão freebsd