Suponha que um investigador suspeite que um aluno copie respostas do trabalho de outro aluno durante um exame de múltipla escolha. Mais tarde, ela verifica as respostas e encontra algumas semelhanças - mas, por outro lado, é provável que haja semelhanças, dada a natureza do exame. Como ela deveria determinar se suas suspeitas foram fundadas?
Em outras palavras, ela certamente terá que comparar os exames com os de outros alunos (que, vamos supor, não estavam trapaceando). Mas se o tamanho da turma for muito grande, é razoável fazer uma amostragem aleatória para comparação? Quantos ela levaria? Se houvesse muitas perguntas no exame, também seria razoável coletar uma amostra das perguntas para comparação? Faz diferença significativa se cada pergunta teve 2 respostas possíveis (verdadeiro / falso) ou, por exemplo, 4?
Não tenho números específicos porque estou pensando em como isso funcionaria em geral. Tenho formação em matemática, mas pouco treinamento em estatística. Como você descreveria essa análise em termos estatísticos?
Obrigado.
fonte
Respostas:
Aqui está uma variedade surpreendentemente vasta de índices de cópias de respostas, com poucas discussões sobre seus méritos: http://www.bjournal.co.uk/paper/BJASS_01_01_06.pdf .
Existe um campo da psicologia (educacional) chamado teoria da resposta ao item (TRI) que fornece a base estatística para perguntas como essas. Se você é americano e fez um SAT, ACT ou GRE, lidou com um teste desenvolvido com o IRT em mente. O postulado básico da TRI é que cada aluno é caracterizado por sua capacidade a i ; cada questão é caracterizada por sua dificuldade b j ; e a probabilidade de responder a uma pergunta corretamente é π ( a i , b j ; c ) = P r o b [ aluno iEu umaEu bj
onde Φ ( z ) é o cdf do padrão normal ec é um parâmetro adicional de sensibilidade / discriminação (às vezes, é tornado específico da pergunta, c j , se houver informações suficientes, ou seja, participantes de teste suficientes para identificar as diferenças). Uma suposição escondida aqui que, dada a estudantes capacidade i
Para perguntas "Sim / Não", esse pode ser o fim da história. Para mais de duas perguntas de categoria, podemos supor que todas as escolhas erradas são igualmente prováveis; para uma pergunta com k j escolhas, a probabilidade de cada escolha errada é π ′ ( a i , b j ; c ) = [ 1 - π ( a i , b j ; c ) ] / ( k j - 1 ) .j kj π′( aEu, bj; c ) = [ 1 - π( aEu, bj; c ) ] / ( kj- 1 )
Para os alunos de habilidades e um k , a probabilidade de que eles combinam em suas respostas para uma pergunta com dificuldade b j é ψ ( um i , um k ; b j , c ) = π ( um i , b j ; c ) π ( a k , b j ; c ) + ( k - 1 ) π ′ (umaEu umak bj
Se desejar, você pode dividir isso em probabilidade de corresponder à resposta correta, ψ c ( a i , a k ; b j , c ) = π ( a i , b j ; c ) π ( a k , b j ; c )
lme4
ou algo muito próximo disso.
fonte