Estou analisando um conjunto de dados contendo observações de n número de tentativas dos jogadores em um jogo. Se estou construindo um modelo de regressão para prever o resultado de cada tentativa, com 1 ou mais descritores em relação à tentativa de cada jogador , como posso medir quantas tentativas um jogador deve ter antes que um descritor em particular se torne "significativo" ou "significativo", conforme nosso conjunto de dados ?
Um bom exemplo seria um grupo de pessoas jogando dardos. Um novato absoluto pode fechar os olhos, lançar o dardo e acertar um alvo. Obviamente, sabemos que foi pura chance, ele nunca jogou antes e, diabos, ele pode até estar intoxicado. Mas digamos que ele atire mais 5 dardos e atinja o alvo, mais 3 vezes em relação a 5. Ele já jogou 6 dardos e atire no alvo 50% das vezes. Agora as coisas estão ficando suspeitas ...
Em que momento esse verdadeiro novato lança dardos suficientes, e quantas tentativas ele precisa antes que possamos dizer que ele tem um talento sério acima de outros jogadores mais experientes? Qual é esse termo em estatística e onde posso aprender mais sobre ele?
Isenção de responsabilidade: tentei evitar o uso de termos estatísticos carregados, como "significado" e "observações", o máximo possível, apesar de achar que eles eram apropriados em certos lugares aqui.
Se alguém puder me apontar na direção certa, isso seria fantástico. Obrigado!!
Respostas:
Dardos é o mais simples dos jogos. Cada jogador começa com uma pontuação de 501 e se revezam para lançar 3 dardos. A pontuação para cada turno é calculada e deduzida do total de jogadores. O bullseye marca 50, o anel externo marca 25 e um dardo no anel duplo ou triplo conta o dobro ou o triplo da pontuação do segmento.
Imagem de
Agora as probabilidades foram examinadas em outro lugar . Nesse site, somos informados de que "um jogador de dardos de habilidade média terá um desvio padrão maior; mesmo que os tiros possam, em média, ser centrados em torno do mesmo alvo, eles serão distribuídos por uma região mais ampla. Um jogador de dardos pobre terá têm um desvio padrão alto e seus disparos serão, probabilisticamente, espalhados por uma região muito mais ampla ". Isto é .
Assim, para responder à pergunta, fazemos o que sempre fazemos. Construímos um histograma de pontuações e, para o jogo em si, podemos usar a pontuação 501, e então ajustamos uma função de densidade, e depois testamos essa função de densidade em relação às funções de densidade de outros jogadores. Portanto, precisamos de dados suficientes para que nossa localização e seu desvio tenham poder preditivo suficiente para discriminar adequadamente entre os jogadores. Quanto menos dados, mais nebulosas as respostas, e não há um número mágico para elas, mais melhor.
fonte