O que causaria alta latência sempre que houver tráfego na WAN?

16

Eu tenho uma rede que está enfrentando velocidades lentas da Internet. Após muita solução de problemas, determinei que qualquer conteúdo / downloads de streaming fará com que a latência do tráfego da WAN exploda.

Por exemplo, sem carga, faço o ping 8.8.8.8 em cerca de 30ms. Se eu começar a transmitir o YouTube no mesmo computador, a latência aumentará para cerca de 500ms, com uma variação de cerca de 400ms. Se eu desligar o vídeo, a latência retornará a 30 ms. Mas, se eu tiver um usuário na mesma LAN, iniciar o streaming pandora, o problema retornará.

Minha rede está sem um único switch 10/100. O switch está conectado diretamente ao roteador DSL. Eu normalmente tenho uma conexão de 6Mb.

Na solução de problemas, concluí o seguinte:

  • Digitalizado com o wireshark de várias estações de trabalho, procurando por pacotes incorretos. (Eu incluiria, mas as varreduras têm informações confidenciais). Nada nem remotamente fora do comum.
  • Roteador substituído por um modelo atualizado e firmware atualizado.
  • O ISP aumentou a velocidade, medida corretamente no speedtest.net (10 para baixo, 1,5 para cima). O problema era exatamente o mesmo.
  • O ISP trocou as placas, apenas no caso de terem uma porta / hardware ruim.
  • Testado em outro escritório com exatamente o mesmo ISP / pacote. Tinha vários computadores transmitindo o YouTube a 1080p e pandora sem afetar a latência.
  • Desligue todos os computadores, exceto um, e funcione à noite quando nenhum usuário estiver lá.
  • Tráfego de LAN monitorado, que nunca apresenta um problema de latência.

Estou ciente de que, se estiver atingindo um limite de largura de banda ou se a velocidade estiver com gargalo em algum hardware, isso causará esse problema. No entanto, não parece assim. Quase todo o tráfego na WAN aumenta a latência. O problema era o mesmo, mesmo quando quase dobrei a velocidade de conexão. Quando recebo dois usuários do pandora e alguns navegam, a internet não dá em nada (pacotes descartados, as páginas não carregam). Eu tenho metade da conexão em casa e nosso streaming simultâneo netflix / youtube / pandora nem toca nos meus 5 Mb.

Pergunta: O que causaria alta latência sempre que o tráfego passar pela WAN?

Blackjack00
fonte
1
esta pergunta cobre uma área ampla, o que você está falando é solucionar uma rede e encontrar um problema. As perguntas devem ser mais específicas. Este btw não tem nada a ver com o wireshark (como descreve sua marcação). Dito isto, bem-vindo à
engenharia de
Alguma resposta o ajudou? Nesse caso, você deve aceitar a resposta para que a pergunta não apareça para sempre, procurando uma resposta. Como alternativa, você pode fornecer e aceitar sua própria resposta.
Ron Maupin

Respostas:

10

Isso soa como alguma forma de " bufferbloat ", provavelmente por parte do DSLAM / LNS que está executando o limite de taxa de 6Mb.

Pode ser sua caixa de CPE, mas é um pouco menos provável.

LapTop006
fonte
+1 Pode haver alguma limitação ou modelagem de taxa mal configurada por parte dos ISPs, mas também pode ser um CPE de baixa qualidade (ou com mau funcionamento). Vi CPEs classificados em 40Mbps começarem a tombar em 10Mpbs porque eles não conseguem lidar com uma alta taxa de pps, por exemplo. Uma alta taxa de pps de pacotes pequenos realmente os sobrecarrega.
Jwbensley # 22/13
Ah, eu não tinha visto que ele havia substituído o CPE. Eu perdi esse ponto!
Jwbensley #
9

Eu verificaria onde a latência está ocorrendo. Use uma ferramenta como a MTR, que verifica a latência em cada salto. O MTR combina estatísticas de ping para cada salto com uma rota de rastreamento e pode ajudar bastante a diminuir esse tipo de problema.

Em uma caixa Linux, o comando seria mtr 8.8.8.8, também há uma versão para Windows desta ferramenta.

A saída mostrará onde a latência começa. Se estiver na rede do ISP, você poderá encaminhar a saída para o ISP e ajudá-lo a usá-lo para solucionar problemas de rede.

Se a latência começar dentro da sua rede, você também poderá diminuir o problema.

Brett Lykins
fonte
1
existe uma versão mtr disponível para dispositivos Cisco IOS? Eu sei que ele pode ser executado a partir do Junos CLI
DrBru 23/10
5

Verifique as estatísticas da linha DSL. (intercalado x caminho rápido, contadores de erros etc.)

O teste em um local diferente testou uma linha diferente , talvez em um DSLAM diferente. Isso sugere que a infraestrutura do ISP não é a culpada. Isso sugere fortemente que sua linha DSL está com defeito. Possivelmente, o próprio DSLAM está congestionado, mas é altamente improvável que você seja o único a empurrá-lo de maneira previsível e repetida.

Se as células ATM estiverem sendo corrompidas (o transporte para a maioria das DSL), você verá lentidão significativa como essa, pois todo o quadro precisa ser reenviado.

Ricky Beam
fonte
3

Sempre que tenho casos em que um cliente está enfrentando latência de rede, a primeira coisa a fazer é verificar cada conexão individual na rede. Geralmente, há um dispositivo em que um gargalo está ocorrendo.

Se for uma rede de baixo uso, eu desativaria completamente a QoS em tudo, exceto no dispositivo conectado à Internet (pois a QoS diminuirá o tráfego em um ambiente de comutação).

Nas capturas de pacotes, eu faria uma análise de E / S e veria se você está obtendo platôs em qualquer lugar. Isso pode indicar tráfego estourado, o que causaria enfileiramento, o que atrasará a entrega de pacotes ou se livrará completamente dos pacotes.

Eu também verificaria a CPU de cada dispositivo quando você tiver o problema. Se você vir a CPU subindo, provavelmente esse é o seu problema no dispositivo. Verifique os logs também para ver se há algum erro.

Além disso, eu teria certeza de que todas as conexões estão negociando em velocidade máxima (velocidade 100 full duplex).

Tente também desativar qualquer firewall ou serviços de segurança.

Trent
fonte
2

Outra coisa a considerar seria a conexão entre seu switch e o modem DSL. Os sintomas que você está descrevendo quase soam como se houvesse uma incompatibilidade duplex entre os dois.

Outra maneira de descartar o switch é removê-lo completamente e testar a conexão com uma máquina conectada diretamente ao modem DSL.

user204
fonte
2

Alta latência / taxa de transferência ruim quando o tráfego é alto às vezes indica um problema de L1 (incompatibilidade duplex / cabo incorreto / fibra suja). Verificou que não é esse o caso?


fonte
0

Poderia ser um gargalo a montante? Não sabe ao certo onde você está no mundo, mas talvez o ISP tenha uma largura de banda internacional terrível. Speedtest.net seria o padrão para o servidor mais próximo.

Rick
fonte
0

O método simples que usei foi a função traceroute, procurando os altos tempos de resposta nos rastreamentos e verificando se há falhas no hardware, ataques do DOS, classificações inadequadas de QoS no sistema e outras coisas. é claro que você precisa acessar todos os equipamentos no caminho. Foi fácil para mim durante esses tempos, desde que eu trabalhava para telecomunicações.

bwindle66
fonte
0

Qual é o sistema operacional em que você está testando isso? Se for Windows, por padrão, há o serviço "QoS Packet Scheduler" instalado e vinculado à interface de rede. Ele será ativado dependendo das configurações subjacentes da pilha de rede e atrasará proativamente qualquer tráfego que não seja classificado como "multimídia".

Tente excluí-lo da interface e verifique novamente seus resultados.

Ou melhor ainda, reconfigure-o corretamente: http://www.dslreports.com/faq/3688

Łukasz Bromirski
fonte
0

Eu acrescentaria, por minha experiência, que alguns ISP tratam pacotes ICMP com a menor prioridade. Isso aconteceu uma vez, toda vez que eu inicio o youtube, até tenho "pedidos esgotados".

Poste winmtr antes de iniciar o vídeo e enquanto o vídeo estiver sendo reproduzido. Inicie um segundo streaming e vamos ver como isso afetará os pacotes ICMP e o 1º vídeo.

laf
fonte
0

Se você estiver se conectando por um switch 10/100 e tiver uma negociação automática de parte dele, poderá haver uma incompatibilidade duplex. Isso causará colisões frequentes quando houver carga na rede que não será exibida quando as coisas estiverem relativamente silenciosas. As colisões causarão reenvios e forçarão o retorno das comunicações e podem causar uma desaceleração aparentemente irracional.

Buz_Dale
fonte
0

Desculpe reviver um tópico antigo. O OP escreveu:

... Quase todo o tráfego na WAN aumenta a latência ...

Estes são os sintomas exatos do Bufferbloat. O roteador provavelmente está enfileirando muito tráfego e passando pequenos fluxos famintos (necessários para fornecer capacidade de resposta).

Seu roteador precisa de uma maneira de atenuar o problema de "latência sob carga". Você poderia andar com QoS, mas isso requer muita configuração e ajuste contínuo.

O estado da arte avançou desde o OP; procure Bufferbloat, AQM, CoDel, fq_codel, Cake, PIE ou outras técnicas.

richb-hanover
fonte