gildot

Topo
Sobre
FAQ
Tópicos
Autores
Preferências
Artigos
Sondagens
Propor artigo


8/3
gildicas
9/30
jobs
10/9
perguntas
10/25
press

 
problemas com conectividade internacional
Contribuído por scorpio em 18-06-06 14:06
do departamento networking-woes
News Durante a noite de ontem (16 para 17), verificaram-se problemas de conectividade para redes internacionais (desde Portugal) de forma praticamente generalizada. Aparentemente, mais de um operador usa / usava a mesma fibra óptica para sair para o estrangeiro, tendo-se verificado um corte desta fibra, afectando consideravelmente as comunicações internacionais.
Foi possível verificar este problema (que depois de causar efectiva falha de conectividade passou a verificar-se de forma intermitente) na CPRM, por exemplo. Para além de ser extremamente preocupante este (aparente) ponto único de falha, é igualmente preocupante a (também) aparente dependência de outros operadores desta infraestrutura. Inside information, anyone?
Indicador da CPRM, durante o problema.

Desvanecimento das comunidades | WCAG 2.0  >

 

gildot Login
Login:

Password:

Referências
  • Indicador da CPRM, durante o problema
  • Mais acerca News
  • Também por scorpio
  • Esta discussão foi arquivada. Não se pode acrescentar nenhum comentário.
    Well.... (Pontos:2, Engraçado)
    por tonidosimpostos em 18-06-06 16:17 GMT (#1)
    (Utilizador Info)
    O grafico só mostra uma redução da ocupação de banda. A explicação ? A improbabilidade de os nerds todos terem finalmente saido de casa e largado o computador :X

    ----------
    the local "free software and the four essential liberties"-zealot

    Guess who ???

    http://pfig.livejournal.com/98617.html

    Re:Well.... (Pontos:1)
    por Sonekas em 18-06-06 21:58 GMT (#3)
    (Utilizador Info)
    nah... é mais fácil a microsoft lançar um SO bug-free e seguro do que os nerds sairem de casa. até porque agora estão aí as "férias grandes"... esse mitico periodo em que os nerds passam ainda mais tempo no PC.
    Não há sistemas infaliveis... (Pontos:2, Esclarecedor)
    por pac em 18-06-06 21:27 GMT (#2)
    (Utilizador Info)
  • Quando foi a ultima vez que algo semelhante ocorreu?
  • Estamos na "ponta" da Europa. A escolha de recursos de fibra optica para o resto do mundo é limitada.
  • A generalidade dos sistemas são desenhados para recuperar/resistir a uma unica falha. Duas em simultâneo podem ser fatais.
  • A CPRMNET perdeu grande parte da conectividade para a Europa mas conseguiu manter todas as ligações para os EUA.
  • Dado o dia e a hora, e com a utilização da rede no seu máximo, a perda de parte da conectividade teve muito mais impacto.

    Have fun,
    pac

  • Re:Não há sistemas infaliveis... (Pontos:2)
    por scorpio em 18-06-06 22:39 GMT (#4)
    (Utilizador Info) http://eurotux.com/
    Uma adenda: tendo em conta a experiência pessoal, posso dizer que a conectividade EUA - Portugal (algumas redes, mais exactamente cerca de 15 servidores em diferentes ISPs) efectivamente não se verificou durante grande parte destas duas horas.
    alguns factos (Pontos:4, Esclarecedor)
    por nvieira em 18-06-06 23:48 GMT (#5)
    (Utilizador Info)
    afaik, o problema foi originado algures na rede de fibra optica da ONI (sim, da ONI).

    A ONI aluga fibra escura a vários operadores internacionais, nomeadamente à COLT e à VSNL International (ex-tyco).

    Nós aqui (na NFSi) alugamos capacidade a alguns operadores (pelos vistos não os suficientes), e sofremos do mesmo sindrome que a CPRM sofreu.

    voltando ao problema, o que soube e ao que tive acesso foi que havia um problema num cabo de fibra e que tiveram que proceder à sua substituição around the clock, ainda que tenha sido impossivel não haver crise (downtime).

    penso (tenho a certeza) que hoje (segunda-feira) de manhã algumas cabeças vao rolar, pois era suposto a estes operadores (que alugam infraestrutura a outros) terem alguma redundancia e resilencia na rede, para evitar estes SPOF's.

    No nosso caso, em que compramos serviços quer para Este quer para Oeste (Madrid e Londes), ambos os serviços estiveram em baixo.

    sad, but true...

    dizem que a culpa é dos ratos... imho, onde passam uma fibra, deviam passar um cabinho de media tensão, untado com queijo... ;-)

    cheers
     
    Re:alguns factos (Pontos:2)
    por gass em 18-06-06 23:56 GMT (#6)
    (Utilizador Info) http://www.otiliamatos.ath.cx/~gass
    "dizem que a culpa é dos ratos... imho, onde passam uma fibra, deviam passar um cabinho de media tensão, untado com queijo... ;-) "

    os obreiros que n vedaram convenientemente as saidas dos cabos das condutas, esses sim, deveriam ser ligados a 2 fios com uma grande diferença de potencial.

    anyway, sei à muito que a oni pretende criar uma nova rede fixa, não sabia era que já tinha fibra (pelo menos da escura) espalhada por aí. Pensava é que a refertelecom é que andava nisso.

    Quanto ao rolar de cabeças, além da redundância, o periodo de substituição não deveria ser de tanto tempo, lá por ser fim de semana, a empresa presta um serviço, que tem que manter a todo o custo.

    enfim. Coisas feitas em cima do joelho.
    Cumps-
    Gass
    Re:alguns factos (Pontos:2, Informativo)
    por nvieira em 19-06-06 0:09 GMT (#7)
    (Utilizador Info)
    a oni usa fibra nas autoestradas (brisa, ...) do gas (transgas), depois ainda tens a EDP e a REN, embora saiba apenas q usam os sites da EDP como POP's.
    Re:alguns factos (Pontos:1)
    por nvieira em 19-06-06 0:43 GMT (#8)
    (Utilizador Info)
    o tempo de reposição nem foi dos piores que já vi...

    a quebra foram 2 horas e tal... (desde service down a service up)
    Re:alguns factos (Pontos:0)
    por mrmv em 19-06-06 15:42 GMT (#12)
    (Utilizador Info) http://spaces.msn.com/members/shadeofwindows
    "que tem que manter a todo o custo."

    Ao que lhe for contratado queres tu dizer ;o)


    No pós-festa cá estaremos a trabalhar, com muito menos pompa, mas com muito mais resultados.
    Pai do Linius
    Re:alguns factos (Pontos:2)
    por nmarques em 19-06-06 20:05 GMT (#13)
    (Utilizador Info) http://www,frente-nacional.org
    Para ti... e só mesmo porque é para ti meu caro nvieira:

    http://www.grease4sale.com/lubricants_specialty_products/motor_oils/lb-aircooled.JPG

    E mais não digo!
    --
    Smash the Reds!
    E o DNS? (Pontos:3, Interessante)
    por CrLf em 19-06-06 2:26 GMT (#9)
    (Utilizador Info) http://tudo-sobre-nada.blogspot.com
    A primeira coisa que eu notei foi a incapacidade dos DNS da Telepac resolverem domínios ".com", ".org" e afins. Comentando os forwarders no meu BIND local foi suficiente para voltar a ter tudo a funcionar (mais lento, mas a funcionar).

    Portanto, a parte curiosa é esta... Se o tráfego para a Europa começou logo a circular via EUA, porque é que os DNS (da Telepac e FCCN, pelo menos) continuavam a não responder normalmente? Se o meu BIND conseguia encontrar um caminho para os nameservers de topo, concerteza os outros também conseguiriam.

    Portanto, o problema que a maioria dos utilizadores notaram como uma quebra total de conectividade internacional, na verdade foi uma quebra do DNS.

    É curioso não?

    --
    Carlos Rodrigues
    Re:E o DNS? (Pontos:1)
    por nvieira em 19-06-06 13:59 GMT (#11)
    (Utilizador Info)
    aparentemente a FCCN tambem foi afectada por este evento.

    nao concordo quando refere que foi uma quebra de DNS. Foi efectivamente uma quebra de conectividade.

    No caso de alguns providers, apesar de terem tido routing alternativo por outros caminhos que não o da fibra afectada,, mas algo correu mal, pois não se chegava a muito lado (bgp damping? partial routing?)


    Re:E o DNS? (Pontos:2)
    por CrLf em 19-06-06 20:56 GMT (#14)
    (Utilizador Info) http://tudo-sobre-nada.blogspot.com
    Eu digo o que digo a partir dos testes que fiz a partir de casa e a partir da FCT/UNL.

    Um traceroute ao "rediris.es" ou ao "amazon.de" (entre outros) mostrava o tráfego a seguir pelos EUA (Miami -> Washington -> Londres -> ...), mas chegavam lá. Portanto, havia conectividade mas os DNS não resolviam os nomes.

    Pouco depois da 1h os DNS da Telepac e da FCCN começaram a conseguir resolver nomes internacionais... nessa altura voltei a fazer uns traceroutes e verifiquei que as rotas já seguiam directamente para a Europa novamente.

    Portanto, do meu ponto de vista apenas posso tirar as seguintes conclusões:

    1. Houve uma quebra efectiva de conectividade directa com a Europa, mas o serviço continuava a funcionar (embora degradado) via EUA;

    2. Ao mesmo tempo que o tráfego conseguia chegar a todos os destinos que experimentei, os DNS da FCCN e da Telepac (pelo menos) não conseguiam resolver nomes internacionais;

    3. Os DNS da Telepac e da FCCN só voltaram a funcionar normalmente no momento em que a conectividade directa para a Europa foi reestabelecida.

    Qual é a conclusão? Os DNS da Telepac e da FCCN não funcionam quando não há conectividade directa com a Europa (mesmo que o tráfego consiga circular por rotas alternativas). Porquê? Não faço a mínima ideia...

    O que é certo é que alguma rota não foi actualizada algures, e só se manifestava ao tentar resolver nomes usando um DNS nacional.

    --
    Carlos Rodrigues
    RIS never sleeps (Pontos:2, Informativo)
    por nvieira em 19-06-06 13:39 GMT (#10)
    (Utilizador Info)
    Bem,

    Para os mais curiosos, podem aceder ao RIS atraves do URL http://www.ris.ripe.net/bgplay/ onde podem ver os path changes, reannouncements, withdrawns, etc..

    Teem q ter o JAVA instalado, aceder a esse URL e clicar no botao "BGPLAY"

    De seguida, devem escolher um prefixo (ver alguns abaixo) e definir o time-frame, idealmente entre: 16.06.2006 as 22:00 e 17.06.2006 as 03:00

    alguns prefixos nacionais: (nem todos afectados)

    Telepac: 194.65.0.0/16
    CPRM: 195.8.0.0/19
    NFSi: 81.92.192.0/19
    Novis: 195.23.0.0/16
    Vianetworks: 195.22.0.0/19
    Vodafone: 213.30.0.0/17
    Netcabo: 213.113.160.0/19
    Cabovisao: 213.228.128.0/18
    FCCN: 193.136.0.0/15

    agora há que apurar a causa real e mitigar ou criar ainda mais contingencia, de forma a que isto não se volte a repetir.

    cheers,

     

     

    [ Topo | FAQ | Editores | Contacto ]