Aqui está uma simples questão estatística que me foi dada. Não tenho muita certeza de entender.
X = o número de pontos adquiridos em um exame (múltipla escolha e resposta certa são um ponto). O binômio X é distribuído?
A resposta do professor foi:
Sim, porque existem apenas respostas certas ou erradas.
Minha resposta:
Não, porque cada pergunta tem uma "probabilidade de sucesso" diferente p. Como eu entendi, uma distribuição binomial é apenas uma série de experimentos de Bernoulli, cada um com um resultado simples (sucesso ou fracasso) com uma dada probabilidade de sucesso p (e todos são "idênticos" em relação a p). Por exemplo, ao jogar uma moeda (justa) 100 vezes, são 100 experimentos de Bernoulli e todos têm p = 0,5. Mas aqui as perguntas têm diferentes tipos de p certo?
fonte
Respostas:
Eu concordo com sua resposta. Normalmente, esse tipo de dados hoje em dia seria modelado com algum tipo de modelo da Teoria de Resposta ao Item . Por exemplo, se você usasse o modelo Rasch , a resposta binária seria modelada comoXn eu
onde pode ser pensado como a capacidade da n- ésima pessoa e δ i como a i- ésima questão da dificuldade. Portanto, o modelo permite que você perceba o fato de que pessoas diferentes variam em habilidades e questões variam em dificuldade, e esse é o mais simples dos modelos de TRI.βn n δEu Eu
Sua resposta professores pressupõe que todas as questões têm a mesma probabilidade de "sucesso" e são independentes, uma vez binomial é uma distribuição de uma soma de iid tentativas de Bernoulli. Ele ignora os dois tipos de dependências descritos acima.n
Mesmo sob a suposição "nula" sobre adivinhação, isso pressupõe que não há padrões de adivinhação; portanto, as pessoas não diferem na maneira como adivinham e os itens não diferem na maneira como são adivinhadas - portanto, a adivinhação é puramente aleatória.
fonte
A resposta para esse problema depende do enquadramento da pergunta e quando as informações são obtidas. No geral, costumo concordar com o professor, mas acho que a explicação de sua resposta é ruim e a pergunta do professor deve incluir mais informações antecipadamente.
Se você considerar um número infinito de possíveis perguntas do exame e desenhar uma aleatoriamente para a pergunta 1, faça uma aleatoriamente para a pergunta 2, etc. Em seguida, faça o exame:
Sob essa estrutura, as suposições de um experimento binomial são atendidas.
Infelizmente, problemas estatísticos mal propostos são muito comuns na prática, não apenas nos exames. Eu não hesitaria em defender sua lógica com seu professor.
fonte
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.
- Acho que você deve deixar explícita a suposição de que as perguntas dos exames são elaboradas independentemente do conjunto de possíveis perguntas. Seria mais realista correlacioná-los: se a pergunta 1 for fácil, é provável que você esteja recebendo um exame fácil e essa pergunta 2 será fácil.Se houver n perguntas, e eu puder responder a qualquer pergunta corretamente com probabilidade p, e houver tempo suficiente para tentar responder a todas as perguntas, e eu fiz 100 desses testes, então minhas pontuações seriam distribuídas normalmente com uma média de np.
Mas não sou eu repetindo o teste 100 vezes, são 100 candidatos diferentes fazendo um teste, cada um com sua própria probabilidade p. A distribuição desses p's será o fator primordial. Você pode fazer um teste em que p = 0,9 se você estudou bem o assunto, p = 0,1 se não o fez, com muito poucas pessoas entre 0,1 e 0,9. A distribuição dos pontos terá máximos muito fortes em 0,1n e 0,9 n e não estará nem perto da distribuição normal.
Por outro lado, existem testes em que todos podem responder a qualquer pergunta, mas levam diferentes períodos de tempo, para que alguns respondam a todas as n perguntas, e outros respondam menos porque ficam sem tempo. Se pudermos assumir que a velocidade dos candidatos é distribuída normalmente, os pontos estarão próximos do normal distribuído.
Mas muitos testes conterão perguntas muito difíceis e muito fáceis, intencionalmente, para que possamos distinguir entre os melhores candidatos (que responderão a todas as perguntas até certo grau de dificuldade) e os piores candidatos (que somente poderão responder muito perguntas simples). Isso mudaria fortemente a distribuição de pontos.
fonte
Eu já vi perguntas nas aulas de Estatística que modelam as perguntas do exame como binômios, mas elas são enquadradas em algo como:
fonte