Como reformular estatisticamente esta pergunta

Estou analisando um conjunto de dados contendo observações de n número de tentativas dos jogadores em um jogo. Se estou construindo um modelo de regressão para prever o resultado de cada tentativa, com 1 ou mais descritores em relação à tentativa de cada jogador , como posso medir quantas tentativas um jogador deve ter antes que um descritor em particular se torne "significativo" ou "significativo", conforme nosso conjunto de dados ?

Um bom exemplo seria um grupo de pessoas jogando dardos. Um novato absoluto pode fechar os olhos, lançar o dardo e acertar um alvo. Obviamente, sabemos que foi pura chance, ele nunca jogou antes e, diabos, ele pode até estar intoxicado. Mas digamos que ele atire mais 5 dardos e atinja o alvo, mais 3 vezes em relação a 5. Ele já jogou 6 dardos e atire no alvo 50% das vezes. Agora as coisas estão ficando suspeitas ...

Em que momento esse verdadeiro novato lança dardos suficientes, e quantas tentativas ele precisa antes que possamos dizer que ele tem um talento sério acima de outros jogadores mais experientes? Qual é esse termo em estatística e onde posso aprender mais sobre ele?

Isenção de responsabilidade: tentei evitar o uso de termos estatísticos carregados, como "significado" e "observações", o máximo possível, apesar de achar que eles eram apropriados em certos lugares aqui.

Se alguém puder me apontar na direção certa, isso seria fantástico. Obrigado!!

regression statistical-significance bayesian p-value sequence-analysis KidMcC
fonte

Você está a poucos passos de se tornar um Bayesian ...

Marcelo Ventura

Então é uma questão de intervalos de confiança à medida que mais dardos são lançados, até certo ponto?

KidMcC 4/16

O que você está vendo pode ser um teste seqüencial. Ou, você pode querer calcular o poder estatístico, ou seja, quantas amostras você precisa desenhar para reduzir o erro beta; observe que, quando você está olhando para um determinado jogador, as amostras não são independentes. Tudo isso também pode naturalmente ser incorporado a uma estrutura bayesiana, como disse o primeiro comentarista.

Regenschein 5/07/16

Adaptativo e seqüencial são duas palavras-chave úteis.

whuber

Respostas:

Dardos é o mais simples dos jogos. Cada jogador começa com uma pontuação de 501 e se revezam para lançar 3 dardos. A pontuação para cada turno é calculada e deduzida do total de jogadores. O bullseye marca 50, o anel externo marca 25 e um dardo no anel duplo ou triplo conta o dobro ou o triplo da pontuação do segmento.

Imagem de

Agora as probabilidades foram examinadas em outro lugar . Nesse site, somos informados de que "um jogador de dardos de habilidade média terá um desvio padrão maior; mesmo que os tiros possam, em média, ser centrados em torno do mesmo alvo, eles serão distribuídos por uma região mais ampla. Um jogador de dardos pobre terá têm um desvio padrão alto e seus disparos serão, probabilisticamente, espalhados por uma região muito mais ampla ". Isto é .

Assim, para responder à pergunta, fazemos o que sempre fazemos. Construímos um histograma de pontuações e, para o jogo em si, podemos usar a pontuação 501, e então ajustamos uma função de densidade, e depois testamos essa função de densidade em relação às funções de densidade de outros jogadores. Portanto, precisamos de dados suficientes para que nossa localização e seu desvio tenham poder preditivo suficiente para discriminar adequadamente entre os jogadores. Quanto menos dados, mais nebulosas as respostas, e não há um número mágico para elas, mais melhor.

Carl
fonte