Qual seria a maneira correta de avaliar / determinar a consistência de arremesso de 3 pontos de um jogador da NBA? Por exemplo, eu tenho um jogador que dispara 37% da faixa de 3 pontos e faz 200 tentativas o ano todo.
Eu estava pensando em tirar a média móvel de 3 pontos percentuais de um número arbitrário de tiros (digamos 20). Em seguida, use essas médias para determinar o desvio padrão da média de 37%. Usar um tamanho de amostra contínuo de 20 fotos permite apenas uma precisão de 5% na porcentagem de fotos, mas estou preocupado que o uso de muitas fotos não revele as inconsistências no desempenho.
Existe uma abordagem melhor para determinar a consistência?
do an analysis of runs
...Respostas:
Como outro usuário afirmou nos comentários acima, um teste de corrida é a maneira de analisar seus dados de disparo. Ele testa a hipótese de que os elementos da sequência são mutuamente independentes. Se a hipótese for rejeitada, você poderia dizer que o arremesso de 3 pontos do jogador é inconsistente.
Também gostaria de indicar este artigo, pois está diretamente relacionado à sua análise.
fonte
Eu acho que um teste de corrida é uma boa ideia. Para mim, analisando os dados em "chunks", sua intenção é criar um proxy ou controle para "mãos quentes" na consistência do jogador. Há uma enorme literatura sobre esse fenômeno por aí. Um dos melhores artigos foi discutido por Gelman em seu blog em julho de 2015. O título de seu post era "Ei, adivinhem? Há realmente uma mão quente!" ( http://andrewgelman.com/2015/07/09/hey-guess-what-there-really-is-a-hot-hand/ ). O artigo de Gelman é uma refutação de grande parte da literatura anterior, na medida em que detalha os erros cometidos pelas análises anteriores do fenômeno das mãos quentes. O trabalho anterior se concentrou nas probabilidades gerais, em oposição às condicionais. Este artigo apresenta um novo modelo de probabilidade seqüencial (consulte o link para uma referência ao artigo).
Uma boa métrica de consistência que deve controlar as diferenças em, por exemplo, número de fotos tiradas, é o coeficiente de variação. O CV é uma medida de variabilidade invariável e sem dimensão da escala e é calculado dividindo o desvio padrão pela média. O problema que ele tenta resolver é que os desvios padrão são expressos na escala da unidade sob medida, ou seja, não é invariável na escala. Isso significa que as métricas com altos valores médios também tendem a ter desvios mais altos do que as métricas com baixos valores médios. Assim, por exemplo, devido às diferenças em seus valores médios, as medidas da variabilidade da pressão arterial diastólica e sistólica não são diretamente comparáveis. Ao fazer o currículo, sua variabilidade se torna comparável. O mesmo vale para muitas outras métricas, como preços das ações,
Assim, o CV pode ser calculado para muitas métricas e tipos de escala, excluindo informações categóricas e medidas com valores negativos.
fonte