O que a latência P99 representa? Eu continuo ouvindo sobre isso nas discussões sobre o desempenho de um aplicativo, mas não consegui encontrar um recurso on-line que falasse sobre isso.
web-services
networking
web-applications
p99
Maverik
fonte
fonte
Should
nãowill
.Imagine que você esteja coletando dados de desempenho do seu serviço e a tabela abaixo é a coleção de resultados (os valores de latência são fictícios para ilustrar a idéia).
A latência P99 do seu serviço é 7s. Apenas 1% das solicitações demoram mais que isso. Portanto, se você pode diminuir a latência P99 do seu serviço, aumenta seu desempenho.
fonte
Vamos dar um exemplo daqui
Então, podemos dizer que, 99% das solicitações da Web, a latência encontrada foi de 1,3ms (ms / microssegundos depende das medidas de latência do sistema configuradas) ou menor. Como o @tranmq disse, se diminuirmos a latência P99 do serviço, podemos aumentar seu desempenho.
E também vale a pena notar o p95, pois poucos pedidos tornam o p99 mais caro que o p95, por exemplo) pedidos iniciais que criam cache, aquecimento de objetos de classe, inicialização de threads ...
Finalmente; podemos ter cerca de 1% de ruído em nossas medições (como congestionamentos de rede, interrupções, degradações de serviços); portanto, a latência da p99 é um bom representante de praticamente o pior caso. E, quase sempre, nosso objetivo é reduzir a latência de p99.
fonte