[FUG-BR] urucubaca 3 a revanche e reboots só na madrugada

Marcelo Gondim gondim em bsdinfo.com.br
Quinta Março 7 08:06:28 BRT 2013


E ae pessoal,

Olha o Beast deve ter brigado com Murphy ou sei lá com quem mas essa até 
agora não descobri. Estou a semana toda tentando desvendar esse mistério 
que me assola. rsrsrsr

Sexta feira foi instalar um equipamento novo para ampliar nosso clear 
channel em fibra para 2 Gbps fazendo link aggregation com 2 Intel Server 
Giga no nosso router de borda.
Até aqui blz sendo que na madrugada seguinte ocorreram alguns reboots 
espontâneos. De sábado até hoje estou sofrendo com reboots espontâneos e 
agora é que vem o detalhe: eles só ocorrem de madrugada entre 00:00 e e 
antes das 09:00. O restante do dia fica 100% normal, sem reboots. Eu 
primeiramente achei que fosse um problema no no-break, então fui lá e 
fiz uns testes no no-break e em nenhum momento o servidor reiniciou. 
Chequei aterramento e tudo. Se removido o no-break da tomada este 
aguenta por mais de 40 minutos tranquilo.
Parti pro sistema, como estou usando a versão 9.1-STABLE peguei a 
revisão que estou usando no meu Firewall aqui sem problemas e compilei a 
mesma revisão no router:

FreeBSD xxx.xxx.xxx.xxx 9.1-STABLE FreeBSD 9.1-STABLE #14 r247497: Thu 
Feb 28 21:32:09 BRT 2013 
root em xxx.xxx.xxx.xxx:/usr/obj/usr/src/sys/XXXXX  amd64

Usei a revisão 247497. Não adiantou e o mais estranho é que foi do nada 
e só ocorre de madruga. No gráfico de uso de link é um horário muito 
tranquilo de menor acesso e para tentar ver o que estava ocorrendo eu 
habilitei o dumpdev na esperança de me gerar algum core em /var/crash 
mas nada de core.

Esse servidor é um Intel Dual Quad Xeon E5606  @ 2.13GHz com 8Gb de ram. 
Tem 3 interfaces de rede Intel Gigabit Server Dual Port chipset 82576 e 
2 Intel Giga Server onboards.
A placa mãe é a Intel Motherboard S5500BC. Um tempo atrás tive problemas 
com esse modelo mas depois de umas atualizadas no firmware o problema sumiu.
Atualizei para o último stable e nada como podem ver no log abaixo, hoje 
rebootou 4 vezes de madruga. Eu estou bolado mesmo é por que só de 
madrugada?
Olhei no cron e não vi nada que explicasse também e os horários são 
muito aleatórios.
Só me restam 2 coisas: trocar a máquina e o no-break.

Abaixo os logs:

boot time                                  Thu Mar  7 05:19
boot time                                  Thu Mar  7 04:19
boot time                                  Thu Mar  7 03:07
boot time                                  Thu Mar  7 02:33
boot time                                  Wed Mar  6 03:14
boot time                                  Wed Mar  6 02:29
boot time                                  Tue Mar  5 04:32
boot time                                  Mon Mar  4 08:16
boot time                                  Mon Mar  4 07:09
boot time                                  Mon Mar  4 05:54
boot time                                  Mon Mar  4 05:14
boot time                                  Mon Mar  4 04:33
boot time                                  Mon Mar  4 04:29
boot time                                  Mon Mar  4 04:10
boot time                                  Mon Mar  4 04:01
boot time                                  Mon Mar  4 03:22
boot time                                  Sun Mar  3 05:55
boot time                                  Sat Mar  2 08:02
boot time                                  Sat Mar  2 07:54
boot time                                  Sat Mar  2 07:11
boot time                                  Sat Mar  2 05:33
boot time                                  Sat Mar  2 05:09
boot time                                  Sat Mar  2 04:56
boot time                                  Sat Mar  2 04:19
boot time                                  Sat Mar  2 04:13
boot time                                  Sat Mar  2 04:04
boot time                                  Sat Mar  2 03:27
boot time                                  Sat Mar  2 03:20
boot time                                  Sat Mar  2 02:51
boot time                                  Sat Mar  2 02:40

[]'s
Gondim



Mais detalhes sobre a lista de discussão freebsd