[FUG-BR] FreeBSD desaparecendo com um núcleo na CPU

Eduardo Lemos de Sa eduardo.lemosdesa em gmail.com
Sexta Novembro 9 15:22:36 BRST 2012


Caro Marcelo

Obrigado pelo seu email e sua ajuda. Vou responder às suas perguntas logo
abaixo de seu questionamento.

2012/11/9 Marcelo Gondim <gondim em bsdinfo.com.br>

> Em 09/11/12 08:29, Eduardo Lemos de Sa escreveu:
> > Caríssimos
> >
> > Incialmente, desculpe-me o subject estranho deste email: escolhi-o para
> > chamar a atenção porque o caso é realmente muito estranho.
> >
> > Há tempos (mais de 1 ano) tenho rodado o FreeBSD/amd64 (iniciei com o
> 8.0 e
> > agora estou no 8.3) em uma máquina com placa-mãe Asus M4a88t-v evo/usb3 e
> > processador amd 1075t-6x sem qualquer problema ou ocorrênciaa estranha.
>> > pouco mais de um mês, notei que a máquina travava (teclado, mouse ou
> > placa-rede estavam totalmente paralizados), todas as quartas-feiras, pela
> > manhã. Eu sei, estranho é (será que inventaram o virus quarta-feira 11, o
>
> Mesmo que você desligue e ligue a máquina na terça à noite, quando chega
> na quarta pela manhã ela trava?
> Tem horário certo também?
> Isso parece algo que esteja rodando no cron. Já verificou ele?
>

Se eu desligar a máquina na terça à noite, e religa-la logo após a passagem
da faxineira, eu começo a trabalhar e ela para.
Já olhei se há crontab rodando como root e nada vi de especial. Desconfio
que o problema não seja de software (afinal, o FreeBSD-8.x tem rodado há
muito tempo, com muita estabilidade e nenhuma atualização de sistema foi
feita recentemente). Além disto, eu tenho outras máquinas rodando o 8.3 e
nenhuma delas trava.



>
> > sucessor do sexta-feira 13 para sistemas unix :-)?. No início, eu achei
> que
> > pudesse ser a faxineira (que todas as quartas-feira limpa a sala, no
> Ahahaha é mesmo, pior que isso acontece. A empresa para a qual trabalhei
> uns anos atrás, tinha um cliente que reclamava que o sistema sempre caía
> todos os dias por volta das 12:00 e voltava uns 15 à 20 minutos depois.
> Como o cliente era perto de onde eu morava, marquei uma visita perto das
> 12:00, cheguei lá e fiquei sentado esperando dar o horário do problema.
> Quando foi por voltas das 12:05 me entra um funcionário deles apressado
> e dizendo: fome, muita fome. O dito cujo me abre a geladeira, cata uma
> marmita térmica, tira o switch principal da rede da tomada, como quem
> desliga uma cafeteira e coloca a marmita dele pra esquentar. HAhaHAhaH
> Finalmente descobrimos o mistério!
> Haviam outros casos também que o sistema parava sempre as 17:30 e aí
> quando fomos checar era a funcionária que queria sair mais cedo e dizia
> para o chefe que o sistema estava fora. rsrsrs
>



É, tem de tudo no mundo da informática. Onde eu fiz pós-graduação, a rede
caía todos os dias entre 17:15 e 17:45. Após um tempo de procura,
descobrimos que um secretário, para "proteger" os dados de seu micro (que
ficava desligado quando ele saía) abria a rede (naquela época, usava-se um
longo cabo que percorria todo o prédio em forma de anel, onde as conexões
com os micros eram feitas através de um "T" que ligava o cabo à placa de
rede).


>
> > período da manhã), daí resolvi deixar a máquina desligada de terça à
> noite
> > até o momento da faxina acabar. De nada adiantou, e o micro congelava o
> > video e não aceitava mais comandos. Troquei então a placa de video (que
> > geralmente é a culpada quando a tela congela), e de nada adiantou.
> > O mais estranho é que, de uns tempos para cá (não sei precisar a data), o
> > top mostrava processamento nos núcleos de 0 a 4 (=5 núcleos, quando antes
> > funcionavam 6). Ativando o corre unlocker na bios, notei que "5 cores are
> > actived" (ou seja, o sexto núcleo está desligado).
> > A minha suspeita é que o processador ou a placa-mãe (ou ambos) estejam
> > danificados, porém, eu gostaria de ouvir a opinião dos caríssimos para
> > saber:
> Esse lance do processador pode estar influenciando mas o que me intriga
> é: por que sempre às quartas de manhã? rsrsrs
>
> > 1) Há algum software que me permita checar o funcionamento correto da
> > placa-mãe e do processador? Eu tenho usado o mbmon para monitar as
> > temperaturas e tensões do processador e placa-mãe, e parece estar tudo
> > normal.
> Ummm para teste de CPU não sei não. Acho que só usando algo para
> estressar eles.
>
>
Vou usar um teste passado  pelo Otacílio e debugado por vários usuários e
ver o resultado.
De qualquer forma, creio que o problema seja de hardware porque o
desaparecimento de um núcleo de processamento não pode ser efeito de uma
alteração causada pelo software.

>
> > 2) O passo seguinte é substitur a(s) peça(s), mas temo que instalar um
> > processador novo (no mercado, agora, só há cpus com 4 núcleos para o
> socket
> > AM3) em uma placa-mãe avariada possa danificar o novo processador e não
> > resolver o problema.
> >
> > 3) Ao que tudo indica, as memórias estão em bom estado (estado do Paraná
> > :-)), porque não ocorreram falhas de core dump (que, suponho eu, sejam o
> > principal sintoma deste tipo de problema). Porém, não tenho certeza disto
> > porque a ausênciaa de core dumps é baseada em uma suposição de alguém que
> > não tem formação na área de informática ou eletrônica, e gostaria de
> ouvir
> > a opinião de pessoas mais habilitadas que eu neste assunto.
> Depende. Já tive um caso que não haviam segfaults aparentes mas a
> máquina estava travando direto. Passei um memtest e acusou 1 banco com
> problemas. Troquei o mesmo e tudo normalizou. Mas volto na questão.. por
> que nas quartas pela manhã?  :)

Parece que algo roda nesse dia. O padrão do periodic semanal é rodar aos
> sábados. Então não deve ser ele mas é melhor checar o seu.
>

Como eu disse, não há crontab rodando neste horário.
Eu tentei ver se não era problema do S.O. então aproveitei uma instalação
do win7 (que estava quase esquecida em uma partição do HD). Bootei pelo
win7 e tudo (exceto o core faltante) estava rodando. O difícil é confiar no
resultado de um teste de hardware quando se usa um win7 como s.o. (que vai
dar problema, isto é certo, mas como garantir que o problema não foi
causado por um bug no sistema operacional e não no hardware). Pode parecer
estranho, mas há pessoas que juram que as máquinas rodando s.o. da
Microsoft estão sujeitas a travamentos :-).


Agradeço novamente a atenção

Edu


>
> > Agradeço a atenção
> >
> >
> > Eduardo
> >
> > Eduardo Lemos de Sa
> > Associated Professor Level 3
> > Dep. Quimica da Universidade Federal do Paraná
> > fone: +55(41)3361-3300
> > fax:   +55(41)3361-3186
> > Voip Number call to (41) 33613600 (listen to the message and type
> 10531185)
> > -------------------------
> > Histórico: http://www.fug.com.br/historico/html/freebsd/
> > Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
> >
>
>
>
> -------------------------
> Histórico: http://www.fug.com.br/historico/html/freebsd/
> Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd
>



-- 
Eduardo Lemos de Sa
Associated Professor Level 3
Dep. Quimica da Universidade Federal do Paraná
fone: +55(41)3361-3300
fax:   +55(41)3361-3186
Voip Number call to (41) 33613600 (listen to the message and type 10531185)


Mais detalhes sobre a lista de discussão freebsd