Bits por segundo vs. Pacotes por segundo

40

Ultimamente, tenho verificado as fichas técnicas de vários modelos de switch de diferentes fornecedores. Para um determinado switch, os fornecedores publicam alguns números que considero uma medida da capacidade / desempenho do switch:

  • Um valor é sempre medido em pacotes por segundo
  • O outro é sempre medido em bits por segundo

Apesar de diferentes fornecedores usarem nomes diferentes para os números, parece que o significado é sempre o mesmo.

Eu gostaria de entender três coisas:

  1. Qual é o significado exato de cada figura?
  2. Qual a diferença entre eles?
  3. Quando devo me concentrar em cada valor para a avaliação do switch?
Daniel Yuste Aroca
fonte

Respostas:

32

Eu só quero mencionar brevemente a realidade da matemática de marketing quando você estiver considerando as folhas de dados do fornecedor. É muito comum os fornecedores contarem duas vezes a capacidade de bps ou pps quando você possui links full-duplex. Por exemplo, o Catalyst 6500 da Cisco possui um Supervisor 720. 720 é usado porque é comercializado como tendo 720Gbps de capacidade de malha.

Mas ... se você perguntar como a Cisco calcula 720Gbps, a resposta é:

  • 80Gbps de tecido por slot vezes 9 slots em um chassi

O problema aqui é que sua malha é apenas uma malha full-duplex de 40 Gbps ... No entanto, a Cisco conta a entrada e a saída no número 720G, mesmo que não faça sentido contar dessa maneira. A conclusão é que às vezes você precisa ter cuidado e inspecionar como aplicar os números na literatura de fornecedores à realidade.

Quase todo fornecedor torce números de marketing como esse, e eu só escolho o Cat6500 porque estou muito familiarizado com a plataforma. Isso não é uma condenação da Cisco ou do Cat6500 (pelo qual realmente tenho uma paixão).

Qual é o significado exato de cada figura? Qual a diferença entre eles?

  • bps
    • Número de bits de dados por segundo que podem ser processados ​​sem descartar dados. bps é quase sempre medido usando cargas ethernet de 1500 bytes (ou potencialmente maiores).
    • O bps é freqüentemente usado ao medir a capacidade de componentes que interconectam várias placas de linha ou portas em um chassi (como uma malha de switch). Ocasionalmente, um mecanismo de processamento central pode ter uma limitação de bps ...
  • pps
    • Número de pacotes de dados por segundo que podem ser processados ​​antes de descartar os dados; pps é sempre medido usando os menores tamanhos de pacotes possíveis.
    • O pps é freqüentemente usado ao medir componentes que procuram dentro de um cabeçalho de pacote (para um endereço IP, endereço mac, valor DSCP, etc ...). Por exemplo, a capacidade dos processadores de rotas e comutadores é medida em pps.

Quando devo me concentrar em cada valor para a avaliação do switch?

Há um tempo e um local para esse tipo de análise, mas a maioria das pessoas usa apenas uma pequena fração de sua capacidade de switch pps / bps, a menos que seja um switch top de rack em um data center ocupado ou um switch central para médias e grandes empresas provedor de serviços POP.

Mesmo assim, a equipe de vendas do fornecedor pode não estar interessada em destacar as limitações do produto ou pode não entender bem os limites. Além disso, os números de pacotes por segundo geralmente mudam dependendo dos recursos ou da combinação de recursos ativados ... realmente não há substituto para a apresentação de alguns bons casos de teste e para testar o desempenho da caixa com a combinação de recursos que você acha que realmente precisa.

Devido às variações e aos jogos que as pessoas podem jogar com números nas folhas de dados, a coisa mais importante que você pode perguntar ao fornecedor é " mostre-me como você calculou os números bps e pps para este componente ".

Dito isto, os recursos de hardware e software são tão importantes ou mais importantes a considerar do que os números bps / pps de arrancada ... Estou incluindo uma pequena amostra de itens que você pode querer ver ... isso é muito subjetivo. ..

  • Nos motores de encaminhamento (normalmente medidos em pps)

    • Adicione a largura de banda de uma contagem média de portas do chassi e encontre o tamanho médio do pacote (na taxa de não queda anunciada) com os recursos ativados e desativados (compare como esses números podem mudar)
    • Desempenho agregado de IPv4 / IPv6 / MPLS pps (esses números podem mudar, dependendo da plataforma ou combinações de recursos que você usa)
    • Limitações da regra de ACL (no número de ACEs, campos de cabeçalho nos quais você pode filtrar, contadores, etc ...)
    • Número total de prefixos / endereços mac suportados no HW e na DRAM
    • MIBs SNMP suportados
    • Modos de QoS e recursos suportados, bem como a facilidade com que você pode integrar esses recursos de QoS ao restante da sua rede.
    • Tempos de failover do processador de rotas
    • Disponibilidade e confiabilidade de atualizações de software em serviço
    • O SO possui componentes de software modulares
    • As Vlans são localmente significativas para uma interface ou a caixa possui utilização global de vlan
  • tecido / placa de linha conexões de malha / placa de linha ASICs (normalmente medidas em bps)

    • Custo médio por porta 1GE ou 10GE
    • Contagem de portas e taxas de excesso de assinaturas de cartões de linha
    • Tamanhos de buffer de placa e porta
    • Se o switch suporta contrapressão para placas de linha de entrada, se a porta de malha de saída estiver congestionada
    • Replicação multicast vs ingresso
Mike Pennington
fonte
3
No SUP720 bps é calculado combinando dois canais de malha de ~ 20Gbps por placa de linha. No entanto, o tráfego dentro de um canal de malha pode ser comutado localmente e, em 6704, o comutador local possui menos do que a capacidade comercializada. O PPS é limitado pela capacidade no DBUS de enviar pacotes ao PFC para pesquisa (da mesma forma dentro do DFC). É 62,5 MHz com 32B por ciclo. IPv4 é de 2 ciclos, MPLS / IPv6 é de 3 ciclos. Portanto, 62,5 / 2 = IPv4 de 31,25Mpps ou 62,5 / 3 = IPv6 / MPLS de 20,83Mpps. Como o @MikePennington mencionou, o cálculo é específico da plataforma e considerações diferentes dão valor diferente. Normalmente você saberá se precisa se preocupar com eles.
ytti 7/09/13
11
@ytti, a comutação local não é uma função da malha em um Cat6500, a comutação local ocorre no DFC de uma placa de linha dCEF. Quando a comutação local acontece, o pacote é enviado para os ASICs de malha ... mas nunca sai através da malha ... na verdade, é enviado para o ASIC de malha para possível replicação de multicast ... mesmo com canais de 2x20Gbps contando um canal full-duplex como 80 Gbps é matemática de marketing. Ref: Cat 6500 papel arquitetura , Supportforum
Mike Pennington
@ MikePennington você está confundindo termos, está confundindo pesquisa local no DFC e comutação local. A comutação local significa que o pacote é movido de porta em porta sem malha. Mas isso só pode ser feito para o tráfego em que a entrada e a saída estão no mesmo canal de malha. A pesquisa em si pode ser centralizada ou distribuída, ou seja, você não precisa do DFC para capitalizar na comutação local, mas precisa do DFC para fazer pesquisas distribuídas.
ytti 7/09/13
11
@ytti, não há confusão da minha parte, eu sou um ex-engenheiro de marketing técnico da Cisco e fiz apresentações sobre esse assunto exato. A comutação local ainda acontece entre ASICs de malha da mesma placa de linha. Estou criando uma sala de chat no caso de você gostaria de mais esclarecimentos ...
Mike Pennington
11
@ MikePennington Esta é uma resposta MUITO bem escrita, obrigado. Eu fiz alguns testes extensivos de estresse em equipamentos de rede de diferentes fornecedores no passado e, se há uma coisa que eu sei sobre especificações citadas, é que elas são TODAS COMPLETAS bs, até o número de mroutes de um motor de 4500 ou 6500 sup pode segurar. Se puder, peça equipamento de demonstração E treinamento antes da compra. Gosto de executar pessoalmente os testes no equipamento antes de certificá-lo para compra.
John Kennedy #
10

Geralmente você é apresentado com taxa de transferência em Mbps (M-bits / s) e Mpps (M-pacotes / s). Estes são considerados números de taxa de transferência do backplane ou da caixa. Os materiais de marketing geralmente apresentam os números da melhor maneira possível, sob condições ideais de pacotes grandes com 1500 bytes de comprimento. A taxa de transferência realista pode ser obtida sob condições de teste que usam o Internet Mix (IMIX) de dados em que os comprimentos e os protocolos dos pacotes variam.

  1. Mbps vs Mpps - "M" incluído como os números geralmente são mostrados x 10 ^ 6 - é simplesmente a diferença entre a capacidade bruta de comutação ou processamento "bit" vs "pacote". Quando a alternância de hardware é possível, os números assumem as melhores condições em que a alternância de processos (punting para CPU) não é necessária em todos os pacotes.
  2. Como os quadros grandes (não Jumbos) têm cargas úteis de 1500 bytes, esse 1 pacote de 1500 bytes x 8 bits / byte = 12.000 bits.
  3. O Mbps mostra a capacidade da troca de bits ao agregar todas as interfaces. O Mpps ajuda a entender quantos pacotes agregados podem ser manipulados. Tudo isso pode ser alterado se você estiver pensando em algo como módulos de switch Cisco com DFC.
generalnetworkerror
fonte
9

Para adicionar boas respostas dadas por @generalnetworkerror e @MikePennington

Os pps e os bps relatados nas planilhas de dados são números idealizados, não apenas os bps costumam ser contados duas vezes (a contagem dupla vem do fato de que, para atender à interface de 10 Gbps, você precisará de 20 Gbps de largura de banda de memória, portanto, nesse contexto, é justo, mas pode ser confuso para o comprador), como Mike explicou.

Mas eles, especialmente os pps, também são idealizados para um cenário da definição de 'típico' do fornecedor, o cenário tem muito menos efeito em dispositivos do tipo comutador (catalisador Cisco, Juniper ex, Force10, Brocade), pois eles tendem a ser executados em tempo constante Dispositivos do tipo ASIC para pesquisa. E tende a ter mais efeito nos dispositivos do tipo roteador (Cisco ASR9k, Juniper MX, Alcatel SR), pois eles tendem a executar o NPU, que é próximo da CPU normal no design, e leva tempo variável para executar o trabalho.

Esse recurso inerente é explorado quando os fornecedores compram testes 'verificados por terceiros', como a Cisco pode pagar à Miercom para testar o Cisco + Juniper e a Juniper pode pagar ao EANTC para testar o Cisco + Juniper.
Esses engenheiros da EANTC e da Miercom recebem informações internas das duas plataformas e usam essas informações internas para mostrar como uma plataforma (do cliente pagante) supera a outra. Porque eles escolhem casos de teste que visam compromissos no cenário ideal escolhido por esse fornecedor.

Felizmente, raramente no dispositivo de comutação os pps ou bps se tornam um problema para você, é muito mais provável que você seja mordido por, por exemplo, micro-bursting (consequência de pequenos buffers) antes mesmo de se aproximar dos limites de bps / pps da plataforma.
Mais tipicamente, os pps e os bps afetam você em caixas low-end executando CPUs da COTS, ou seja, caixas baseadas em software, como Cisco ISR, filial Juniper SRX ou firewalls.

Em termos muito genéricos e aproximados, o bps mede a largura de banda da memória e o pps mede o desempenho da pesquisa (velocidade da 'CPU')

ytti
fonte
2

Concorde com as afirmações acima, saiba também que todos os fornecedores falsificam um pouco suas estatísticas. ou seja, ative o PAT, regras simples de firewall, listas de controle de acesso, QOS e você descobrirá que esses números podem reduzir pela metade um pouco do tempo - isso geralmente ocorre devido à capacidade de processamento de um dispositivo de rede e todo serviço executado em um dispositivo de rede requer um certo quantidade de recursos da CPU. PPS e BPS nem sempre são as melhores estatísticas para usar.

Ao considerar sua atualização, veja o que você está utilizando no momento. O SNMP (Protocolo Simples de Gerenciamento de Rede) pode ajudá-lo a conseguir isso. Tenha espaço para crescimento, atualizando seu ambiente para obter menos de% 50 de largura de banda na utilização atual da rede no novo dispositivo e menos de% 40 de uso da CPU.

alex_da_gr8
fonte
"Concordo com as afirmações acima" é relativo, pois as posições das respostas mudam com base na votação ou nos laços.
generalnetworkerror