Existe uma pergunta popular, chamada "Melhor pergunta de estatística de todos os tempos".
Se você escolher uma resposta para essa pergunta aleatoriamente, qual é a chance de estar correta?
A) 25% B) 50% C) 60% D) 25%
Esta tarefa não é muito difícil, a resposta correta é 0%. Mas se o modificarmos assim:
Se você escolher uma resposta para essa pergunta aleatoriamente, qual é a chance de estar correta?
A) 50% B) 25% C) 60% D) 50%
Qual será a resposta correta? Temos duas respostas corretas: 25% e 50%, ou não há resposta correta, pois com essas duas respostas corretas a chance de escolher a resposta correta é de fato 75% (mas não temos 75% escritos em cima da mesa )?
A propósito. A resposta 0% permanece correta, a terceira resposta correta neste caso?
probability
paradox
usuario
fonte
fonte
Respostas:
Os aparentes paradoxos (de lógica ou probabilidade) podem ser resolvidos enquadrando as perguntas de forma clara e cuidadosa.
A análise a seguir é motivada pela idéia de defender uma resposta: quando um participante do teste pode exibir um possível estado de coisas (consistente com todas as informações disponíveis) em que sua resposta é realmente correta, deve ser marcado como correto. Equivalentemente, uma resposta está incorreta quando não existe tal defesa; é considerado correto caso contrário. Isso modela as interações usuais entre os alunos (benevolentes, racionais) e os alunos (racionais) :-). O aparente paradoxo é resolvido exibindo várias dessas defesas para a segunda questão, das quais apenas uma poderia ser aplicada em qualquer instância.
Vou pegar o significado de "aleatório" nessas perguntas no sentido convencional: para modelar uma escolha aleatória de resposta, escreverei cada resposta em um pedaço de papel ("bilhete") e colocarei em uma caixa: isso será total de quatro ingressos. Tirar um ingresso da caixa (depois de embaralhar o conteúdo da caixa com cuidado e cegamente) é um modelo físico para uma escolha "aleatória". Motiva e justifica um modelo de probabilidade correspondente .
Agora, o que significa "estar correto"? Na minha ignorância, explorarei todas as possibilidades. De qualquer forma, considero que zero, um ou mais tickets podem estar "corretos". (Como posso saber? Simplesmente consulte a folha de classificação!) Marcarei as respostas "corretas" como tal, escrevendo o valor em cada ticket correto e escrevendo nos outros. Isso é rotina e não deve ser controverso.01 0 0
Uma coisa óbvia, mas importante a ser observada, é que a regra para escrever ou deve se basear apenas na resposta escrita em cada ticket: matematicamente, é um mapeamento (ou reatribuição) enviando o conjunto de respostas listadas ( em ambas as perguntas) no conjunto . Esta regra é necessária para a autoconsistência.1 { .25 , .50 , .60 } { 0 , 1 }0 0 1 { .25 , .50 , .60 } { 0 , 1 }
Vamos voltar ao elemento probabilístico da questão: por definição, a chance de estar correta, sob um sorteio aleatório de tickets, é a expectativa dos valores com os quais eles foram marcados. A expectativa é calculada somando os valores nos tickets e dividindo-os pelo número total. Portanto, será , , , ou ..25 .50 .75 10 0 0,25 .50 0,75 1
Uma marcação fará sentido, desde que apenas os tickets cujas respostas sejam iguais às expectativas sejam marcados com s1 . Este também é um requisito de autoconsistência. Afirmo que este é o cerne da questão: encontrar e interpretar as marcações que fazem sentido. Se não houver, então a própria pergunta pode ser marcada como sem sentido. É uma marcação única, então não haverá controvérsia. Somente se duas ou mais marcações fizerem sentido, haverá alguma dificuldade em potencial.
Quais marcações fazem sentido?
Nem precisamos fazer uma pesquisa exaustiva. Na primeira pergunta , as expectativas listadas nos ingressos são de 25%, 50% e 60%. O último é impossível com quatro ingressos. O primeiro exigiria exatamente um ticket para ser marcado; o segundo, dois ingressos. Isso dá no máximo marcações possíveis para explorar. A única marcação que faz sentido coloca s em cada ticket. Para esta marcação, a expectativa é . Isso justifica a resposta declarada à primeira pergunta. (Indiscutivelmente, a única resposta correta para a primeira pergunta é não selecionar nenhuma resposta!)0 ( 0 + 0 + 0 + 0 ) / 4 = 03 + 3 = 6 0 0 ( 0 + 0 + 0 + 0 ) / 4 = 0
Na segunda pergunta , as mesmas respostas aparecem e mais uma vez há seis marcações a serem exploradas. Desta vez, três marcações são auto-consistentes. Eu os tabulo:
Portanto, existem três definições possíveis distintas de "correto" no segundo problema, levando A ou D a estarem corretos (na solução 1) ou apenas B a estar correto (na solução 2) ou nenhuma das respostas estar correta (em solução 3).
Uma maneira de interpretar esse estado de coisas é que, para cada uma das respostas A, B e D, existe pelo menos uma maneira de marcar os tickets que corrigem essas respostas. Isso não implica que todos os três estejam simultaneamente corretos: não poderiam estar, porque . Se você fosse o avaliador do teste, se marcasse A, B ou D como correto, não receberia uma discussão do examinador; mas se você marcou algum deles incorreto,.25 ≠ .50 o participante do teste teria uma base legítima para contestar sua pontuação: invocaria a solução 1 ou a solução 2. De fato, se um participante do teste se recusasse a responder à pergunta, a solução 3 daria a ele uma base legítima para argumentar que sua não -response também deve receber crédito total!
Em resumo, essa análise aborda a segunda parte da questão, concluindo que qualquer uma das seguintes respostas à pergunta 2 deve ser marcada como correta, pois cada uma delas é defensável : A, B, D, A e D e nada. Nenhuma outra resposta pode ser defendida e, portanto, não estaria correta.
fonte
Eu acho que há uma questão de semântica aqui, além da probabilidade. A escolha aleatória é clara. Cada um de A, B, C e D será selecionado 25%. Mas o que significa estar correto quando você escolhe aleatoriamente? Parece que isso deve significar, dado que você escolhe A como resposta, dê a% correta de amostras que serão corretas e iguais para B, C e D. Portanto, você deve contar 1/4 para cada resposta correta e somar todas as respostas corretas para obter a porcentagem correta. Mas isso leva a um argumento circular. Daí o paradoxo. Isso realmente parece ser uma questão de lógica, e não de probabilidade ou estatística.
fonte
O whuber oferece uma ótima análise, onde várias respostas são permitidas. No entanto, também existe uma maneira consistente de entender a pergunta, de modo que exista apenas uma única resposta correta (embora seja necessário declarar isso como parte da pergunta):
No entanto, precisamos de outro passo lógico para reduzi-los a uma única resposta defensável. Ao fazer esse problema, o professor foi confrontado com três possíveis marcações, cada uma das quais poderia ser a mesma resposta aceitável que as outras. No entanto, como apenas uma resposta pode estar correta, o professor deve escolher aleatoriamente entre eles. Isso atribui uma probabilidade igual a cada marcação para que:
Resumo: se especificarmos que existe apenas uma única resposta correta, essa resposta será de 25%.
fonte
Eu acredito que a resposta é 1/3. Não sabemos qual resposta (25%, 50% ou 60%) está correta. Portanto, cada resposta, 25%, 50% e 60%, tem 1/3 de chance de estar correta, se selecionada. Mesmo que 25% apareça duas vezes, ainda tem 1/3 de chance de ser a resposta correta. Na verdade, não importa quantas vezes 25% aparece como resposta. Se aparecer 10 vezes junto com os 50% e os 60%, a chance de ser a resposta correta ainda será 1/3. Isso pressupõe que uma das respostas esteja correta. Se houver a possibilidade de nenhuma das respostas estar correta, a resposta será 1/4. Isso se baseia na minha interpretação do que a pergunta está fazendo.
fonte