[FUG-BR] Problema sério com link aggregation LACP no FreeBSD 10.2-RELEASE
Marcelo Gondim
gondim em bsdinfo.com.br
Terça Setembro 15 06:28:28 BRT 2015
Olá meus amigos,
Não sei se sou azarado ou o que. Um ano atrás tive problemas com as
interfaces Intel X520-SR2 que do nada elas morriam e eu tinha que ficar
dando down e up pra elas voltarem à vida. Fiquei mais de 1 ano com esse
problema. Tentei as listas e cheguei à fazer até um PR e nada. Um belo
dia atualizei o router no STABLE e pronto, problema resolvido. O que foi
feito não faço ideia mas resolveu depois de 1 ano de sofrimento de ter
trocado todo o hardware e achando que era temperatura interna da X520-SR2.
Patrick até tentou me ajudar nessa época mas o jeito foi deixar um
script testando e levantando a interface sempre que caía. Pura
gambiarra, coisa feia de se ver em um sistema. rsrsrsrsrs
Estava eu usando o router funcionando no 10.1-STABLE r281235 e aí então
resolvi passar o mesmo para o FreeBSD 10.2-RELEASE-p2 devido às
melhorias da 10.1 para a 10.2 e mais uma vez me decepcionei com o sistema.
Eu tenho 2 laggs nesse router e depois que atualizei, quando chegava no
horário de pico e subia o tráfego nesses laggs, simplesmente meu load
subia pra 40.x à 53.x, minha sessão BGP de um desses laggs com a
operadora caía e levantava de 5 em 5 minutos me gerando grande problema
aqui no provedor.
Nos logs ficavam aparecendo:
/var/log/messages:Sep 9 19:21:43 rt01 kernel: igb5: Interface stopped
DISTRIBUTING, possible flapping
/var/log/messages:Sep 9 19:21:44 rt01 kernel: igb4: Interface stopped
DISTRIBUTING, possible flapping
/var/log/messages:Sep 9 19:27:01 rt01 kernel: igb5: Interface stopped
DISTRIBUTING, possible flapping
/var/log/messages:Sep 9 19:27:01 rt01 kernel: igb4: Interface stopped
DISTRIBUTING, possible flapping
/var/log/messages:Sep 9 19:29:13 rt01 kernel: igb5: Interface stopped
DISTRIBUTING, possible flapping
/var/log/messages:Sep 9 19:29:14 rt01 kernel: igb4: Interface stopped
DISTRIBUTING, possible flapping
/var/log/messages:Sep 9 19:46:10 rt01 kernel: igb5: Interface stopped
DISTRIBUTING, possible flapping
/var/log/messages:Sep 9 19:46:11 rt01 kernel: igb4: Interface stopped
DISTRIBUTING, possible flapping
Aí pensei comigo... estava tudo funcionando e não vou cometer o mesmo
erro que cometi com a X520-SR2. Voltei para o 10.1-STABLE r281235 e
pronto! Tudo voltou à funcionar como era antes. Assim fica difícil
confiar na estabilidade e robustez de um sistema. Só Deus sabe agora
quando que isso será resolvido no sistema. 1 ano? 2 anos? Bem, vou
começar à pensar em algo como Juniper porque pelo menos vou poder cobrar
de alguém quando isso acontecer. Uns anos atrás saí do Linux para
FreeBSD porque este resolveu meus problemas, coisas que o Linux não me
atendia mas que agora está me deixando chateado com essas coisas. Saí do
problema do ksoftirq do Linux para outros problemas de instabilidade no
FreeBSD.
Querem ver outra coisa feia que desde o FreeBSD 10.0 existe e já tem PR,
já comentei na freebsd-stable? Tudo bem que pode não afetar o sistema
mas já acertaram na CURRENT faz tempo, pelo menos foi o que me disseram
na lista. É uma coisa feia demais para um sistema tão bem trabalhado:
Experimentem fazer:
# ipfw table 100 add 0.0.0.0/8
Agora o resultado:
# ipfw table 100 list
::/8 0
iptables pode ser estranho ou difícil de aprender mas nunca vi algo
assim nele. Venho desde o FreeBSD 10.0 falando na lista sobre isso e cá
estamos no 10.2 e continua esse bug horrendo.
Bem eu abri o PR sobre o problema do LACP e agora vamos ver quando que
isso vai ser resolvido porque ao meu ver isso é sério e muita gente usa
lagg no sistema e com certeza é um problema porque voltei a versão e
tudo normalizou. Fiquei 3 dias com esse problema me ferrando, para não
dizer outra coisa, aqui no provedor.
https://bugs.freebsd.org/bugzilla/show_bug.cgi?id=203031
Desculpem o desabafo mas puts essa me deixou chateado demais com o
sistema, ainda mais pela importância que ele tem para o meu negócio hoje.
Gondim
Mais detalhes sobre a lista de discussão freebsd