Como sinalizar uma alteração multihoming VPLS para um dispositivo L2 CE

8

Temos a seguinte configuração:

insira a descrição da imagem aqui

Dois roteadores MX se conectam ao mesmo site L2. A proteção / redundância de loop é feita via VPLS multihoming . Na outra extremidade, existem dois comutadores (EX4200, por exemplo).

Quando o link azul falha, os dois comutadores e o restante da infraestrutura L2 precisam saber que o tráfego agora deve passar pelo link amarelo (e consequentemente através do comutador EX à direita).

O problema é que a mac-table amarela é preenchida apenas quando há tráfego vindo do VPLS através do link amarelo. Se nenhum tráfego for recebido de um determinado endereço MAC, o tráfego para esse endereço ainda será enviado pelo link azul e ninguém sabe que o link está quebrado (exceto talvez o comutador EX à esquerda se o link falhar fisicamente).

Não consigo encontrar uma boa solução para corrigir esse problema.

Algumas abordagens:

  1. É possível diminuir um pouco o impacto não tornando o link azul / amarelo portfast para que o spanning tree possa enviar uma alteração de topologia quando a interface for desativada / ativada. Quando a interface não cai fisicamente, você fica sem sorte. Por outro lado, a solução de spanning tree o morderá quando a porta surgir novamente. O VPLS colocará o site online, mas a porta precisará passar pelos estágios de aprendizado do STP antes de encaminhar o tráfego.

  2. Você pode empilhar os dois switches. Isso corrigirá o problema para o restante da infraestrutura L2, pois eles sempre são enviados para o mesmo comutador (pilha). Ainda assim, a pilha precisa saber quando alternar para a outra interface de uplink com a instância ativa do VPLS.

  3. Ao fazer a manutenção planejada (e se você tiver uma pilha), é possível desativar o link primário manualmente para alternar para o link secundário. Em seguida, você pode diminuir a preferência do site pelo link desativado no roteador para que o site agora ativo se torne o novo primário. A mesma coisa ao voltar. Não é o ideal e não funciona para interrupções imprevistas.

Qualquer contribuição sobre como resolver isso é apreciada. (Esperar EVPN / TRILL não conta.;))

Sebastian Wiesinger
fonte

Respostas:

3
  1. Desativar Portfast nas portas voltadas para PE (no CE)
  2. Habilite o RSTP na rede CE
  3. Favor "link azul" com custo de interface

Resolvendo isso na minha cabeça, acredito que deve reagir da seguinte maneira:

Quando o link azul morre, o CE para de enviar / receber BPDUs da interface azul. O temporizador hello RSTP padrão é de 2 segundos. Ele aguarda três saudações perdidas antes de chamar esse link de "morto". Uma vez perdidos três olá (6 segundos), ele restabelecerá a árvore STP e envelhecerá os endereços MAC.

Esta é basicamente a opção 1 que você declarou acima, exceto a maneira como li os comentários e sua postagem original parece que você deseja que o PE participe do STP. Estou sugerindo que o cliente construa sua própria árvore entre todos os CEs.

Sua rede deve funcionar sem problemas e a rede do cliente seguirá o exemplo alguns segundos depois.

Parece simples demais para ser a resposta ... mas é o que posso ver com base na sua redação.

bigmstone
fonte
3

Que tipo de orçamento de convergência você está procurando?

Se você abandonar a idéia de usar a prevenção de loop VPLS e executar o siteID exclusivo, poderá voltar ao STP. Você experimentaria perda de link via BPDU, mesmo na ausência de falha de animação do hardware.

Em seguida, você pode ajustar seu orçamento de convergência por TCN / tempo de avanço (tempo limite do MAC, depois que o TCN for visto) ou por martelo maior 'tempo de envelhecimento de mac'.
O outro lado é que você terá unicast mais desconhecido na rede, o que pode ser contornado, garantindo que o tempo limite do ARP seja menor ou igual a TCN / tempo de avanço

Eu provavelmente não sei a resposta que você está procurando, mas se houver alguma bala de prata aqui, estou perdendo. Eu não acho que o trill ou o rascunho do EVPN o ajudariam nesse cenário, se o seu VPLS ou EVPN fosse end-to-end direto à porta do host, então isso seria corrigido. Mas apenas substituir o VPLS pelo EVPN no núcleo e manter a LAN desconectada em ambos os lados forneceria o mesmo problema.

ytti
fonte
1

Seguindo as opções que você fornece, eu pessoalmente seguiria o nº 1 da sua lista, mas não usaria o ST comum. Eu prefiro usar o RST (ou MST, se você precisar carregar VLANs de equilíbrio entre links), pois ele permite uma transição rápida / suave quando um link é ativado ou desativado.

Isso aborda as duas preocupações que você tem com essa abordagem:

  1. "A interface não diminui fisicamente" - cada dispositivo executando o RST gera BPDUs (em vez de apenas retransmitir) e eles são usados ​​como manter vivo. A falha no recebimento de BPDUs resultará no envelhecimento da informação.
  2. "Necessidade de passar pelos estágios de aprendizado do STP antes de encaminhar o tráfego" - o RST pode confirmar ativamente que uma porta pode fazer a transição com segurança para o estado de encaminhamento sem aguardar temporizadores.

Eu também consideraria fazer o nº 2 além disso, pois isso simplifica o gerenciamento dos dispositivos.

YLearn
fonte
0

Talvez um script de evento possa ser feito no MX "com falha" para remover o link? Se houver algum tipo de transporte iluminado, isso pode não funcionar.

Na maioria dos aplicativos em que trabalhei dessa maneira, tivemos tráfego bidirecional, de modo que os MACs removidos que deveriam ser movidos acabam por chegar pela porta de backup, a entrada antiga do FIB é despejada e a nova porta instalada.

Se o seu site L2 atendido por esses EXes apenas enviar tráfego, a única coisa que eu poderia pensar seria reduzir o tempo de envelhecimento da tabela de mac para uma quantidade aceitável.

jof
fonte