O resultado de um exame é um binômio?

31

Aqui está uma simples questão estatística que me foi dada. Não tenho muita certeza de entender.

X = o número de pontos adquiridos em um exame (múltipla escolha e resposta certa são um ponto). O binômio X é distribuído?

A resposta do professor foi:

Sim, porque existem apenas respostas certas ou erradas.

Minha resposta:

Não, porque cada pergunta tem uma "probabilidade de sucesso" diferente p. Como eu entendi, uma distribuição binomial é apenas uma série de experimentos de Bernoulli, cada um com um resultado simples (sucesso ou fracasso) com uma dada probabilidade de sucesso p (e todos são "idênticos" em relação a p). Por exemplo, ao jogar uma moeda (justa) 100 vezes, são 100 experimentos de Bernoulli e todos têm p = 0,5. Mas aqui as perguntas têm diferentes tipos de p certo?

Paulo
fonte
14
+1 Ainda mais importante: a menos que seja um exame estranho, as respostas às perguntas serão fortemente correlacionadas. Se X é a pontuação total de um indivíduo, isso impedirá uma distribuição binomial. Seria possível que a pergunta estivesse operando sob a hipótese de "hipótese nula", na qual todos os examinadores estão adivinhando independentemente e aleatoriamente todas as respostas?
whuber
2
Quão paradoxal, eu teria pelo menos pressionado por crédito parcial sobre isso, mas a "resposta" parece refletir uma desinclinação em atribuí-lo :) (acho que você está aqui).
Adamo
1
Sim, obrigado: D, eu acho que é mais uma distribuição binomial Poisson (se alguma coisa)
Paul
2
Concordo com todos que a pergunta foi ruim, mas há uma questão de enquadramento aqui. Se este for um curso elementar e for um formato de resposta curta (para que você possa explicar seu raciocínio), eu diria que a melhor resposta é provavelmente "sim (assumindo independência e dificuldade igual para cada pergunta)"; isso indicaria ao professor que (1) você entende as limitações da pergunta e (2) não está tentando ser um espertinho.
quer

Respostas:

25

Eu concordo com sua resposta. Normalmente, esse tipo de dados hoje em dia seria modelado com algum tipo de modelo da Teoria de Resposta ao Item . Por exemplo, se você usasse o modelo Rasch , a resposta binária seria modelada comoXnEu

Pr{XnEu=1}=eβn-δEu1+eβn-δEu

onde pode ser pensado como a capacidade da n- ésima pessoa e δ i como a i- ésima questão da dificuldade. Portanto, o modelo permite que você perceba o fato de que pessoas diferentes variam em habilidades e questões variam em dificuldade, e esse é o mais simples dos modelos de TRI.βnnδEuEu

Sua resposta professores pressupõe que todas as questões têm a mesma probabilidade de "sucesso" e são independentes, uma vez binomial é uma distribuição de uma soma de iid tentativas de Bernoulli. Ele ignora os dois tipos de dependências descritos acima.n

n

Mesmo sob a suposição "nula" sobre adivinhação, isso pressupõe que não há padrões de adivinhação; portanto, as pessoas não diferem na maneira como adivinham e os itens não diferem na maneira como são adivinhadas - portanto, a adivinhação é puramente aleatória.

Tim
fonte
Isso faz sentido! Embora eu ache que você possa calcular a probabilidade da probabilidade de sucesso de uma pergunta, mas a "habilidade das pessoas" parece difícil :) Outra idéia que tive foi modelar isso como uma soma de distribuições de bernulli? Por exemplo, digamos que existem 2 perguntas, portanto 2 probabilidades de sucesso p1 e p2. Analogamente duas variáveis ​​X1 e X2 contando (então 2 experimentos bernulli). Então, por exemplo, a probabilidade de obter uma pontuação total de 1 é P (X1 = 1) * P (X2 = 0) + P (X1 = 0) * P (X2 = 1) = p1 (1-p2) + (p1 -1) p2. Isso soa razoável?
Paul
2
@ Paul soma de dois Bernoulli da com p diferente de Poisson é-binomial
Tim
4
A suposição "nula" é basicamente uma coisa de vaca esférica; você sempre pode discutir exatamente como a vaca é esférica.
Hong Ooi
5

A resposta para esse problema depende do enquadramento da pergunta e quando as informações são obtidas. No geral, costumo concordar com o professor, mas acho que a explicação de sua resposta é ruim e a pergunta do professor deve incluir mais informações antecipadamente.

Se você considerar um número infinito de possíveis perguntas do exame e desenhar uma aleatoriamente para a pergunta 1, faça uma aleatoriamente para a pergunta 2, etc. Em seguida, faça o exame:

  1. Cada pergunta tem dois resultados (certo ou errado)
  2. Há um número fixo de tentativas (perguntas)
  3. p

Sob essa estrutura, as suposições de um experimento binomial são atendidas.

Infelizmente, problemas estatísticos mal propostos são muito comuns na prática, não apenas nos exames. Eu não hesitaria em defender sua lógica com seu professor.

Minador
fonte
Jea, acho que isso também está certo. A questão é apenas "ruim", pois você pode argumentar nos dois sentidos, uma vez que poucas informações são fornecidas. Mas eu fiquei muito infeliz com a resposta dada pelo meu professor.
Paul
4
@Paul, é realmente muito difícil escrever boas perguntas estatísticas. Eu sei que estraguei tudo em muitas ocasiões.
gung - Restabelece Monica
1
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.- Acho que você deve deixar explícita a suposição de que as perguntas dos exames são elaboradas independentemente do conjunto de possíveis perguntas. Seria mais realista correlacioná-los: se a pergunta 1 for fácil, é provável que você esteja recebendo um exame fácil e essa pergunta 2 será fácil.
Adrian
0

Se houver n perguntas, e eu puder responder a qualquer pergunta corretamente com probabilidade p, e houver tempo suficiente para tentar responder a todas as perguntas, e eu fiz 100 desses testes, então minhas pontuações seriam distribuídas normalmente com uma média de np.

Mas não sou eu repetindo o teste 100 vezes, são 100 candidatos diferentes fazendo um teste, cada um com sua própria probabilidade p. A distribuição desses p's será o fator primordial. Você pode fazer um teste em que p = 0,9 se você estudou bem o assunto, p = 0,1 se não o fez, com muito poucas pessoas entre 0,1 e 0,9. A distribuição dos pontos terá máximos muito fortes em 0,1n e 0,9 n e não estará nem perto da distribuição normal.

Por outro lado, existem testes em que todos podem responder a qualquer pergunta, mas levam diferentes períodos de tempo, para que alguns respondam a todas as n perguntas, e outros respondam menos porque ficam sem tempo. Se pudermos assumir que a velocidade dos candidatos é distribuída normalmente, os pontos estarão próximos do normal distribuído.

Mas muitos testes conterão perguntas muito difíceis e muito fáceis, intencionalmente, para que possamos distinguir entre os melhores candidatos (que responderão a todas as perguntas até certo grau de dificuldade) e os piores candidatos (que somente poderão responder muito perguntas simples). Isso mudaria fortemente a distribuição de pontos.

gnasher729
fonte
2
-
2
@ Tim Apesar da dependência desnecessária de distribuições normais e do mistério de fazer 100 testes, esta resposta tem mérito ao tentar demonstrar como um caso específico pode levar a uma distribuição obviamente não binomial. Como tal, poderia ser uma contribuição valiosa para as respostas se essas questões técnicas fossem abordadas.
whuber
0

n n

n

  • 12
  • São independentes . Muitos exames fazem perguntas baseadas nas respostas às perguntas anteriores. Quem pode dizer com certeza que isso não aconteceria no exame desta pergunta? Existem outros fatores que podem dar respostas às perguntas do exame não independentes umas das outras, mas acho que essa é a mais intuitivamente óbvia.

Eu já vi perguntas nas aulas de Estatística que modelam as perguntas do exame como binômios, mas elas são enquadradas em algo como:

Que distribuição de probabilidade modelaria o número de perguntas respondidas corretamente em um exame de múltipla escolha, onde cada pergunta tem quatro opções e o aluno que está fazendo o teste está adivinhando todas as respostas aleatoriamente?

p=14

jjw
fonte
Não há nada com seus fatos, mas a lógica está incorreta: não basta demonstrar que algumas suposições podem não se sustentar, porque (logicamente) a distribuição ainda pode ser binomial em qualquer caso. Você também precisa demonstrar que essas suposições podem falhar de uma maneira que faz com que a distribuição de pontuação seja definitivamente não binomial.
whuber