12 professores estão ensinando 600 alunos. As 12 coortes ensinadas por esses professores variam em tamanho de 40 a 90 alunos, e esperamos diferenças sistemáticas entre as coortes, já que os alunos de pós-graduação foram desproporcionalmente alocados a coortes particulares, e experiências anteriores mostraram que os alunos de pós-graduação, em média, obtêm uma pontuação consideravelmente superior a os estudantes de graduação.
Os professores classificaram todos os trabalhos de sua coorte e atribuíram a eles uma nota de 100.
Cada professor também examinou um trabalho selecionado aleatoriamente de três outros professores e atribuiu uma nota a 100. Cada professor teve três de seus trabalhos marcados por outro professor. Assim, 36 documentos diferentes foram cruzados dessa maneira, e eu os chamo de dados de calibração.
Também posso ver quantos estudantes de pós-graduação estavam em cada coorte.
Minhas perguntas são:
A) Como posso usar esses dados de calibração para ajustar as marcas originais, a fim de torná-las mais justas? Em particular, eu gostaria de lavar o máximo possível os efeitos de fabricantes excessivamente generosos / não generosos.
B) Quão apropriados são meus dados de calibração? Não tive escolha nos 36 pontos de dados de calibração que eu obtive neste curso, e não tenho mais opção de coletar mais durante o semestre atual. No entanto, se essa situação persistir, talvez eu consiga coletar mais dados de calibração ou coletar diferentes tipos de dados de calibração.
Esta pergunta é um parente de uma pergunta popular que eu fiz: Como posso lidar melhor com os efeitos de marcadores com diferentes níveis de generosidade na classificação dos trabalhos dos alunos? . No entanto, é um curso diferente e não tenho certeza de quão útil seria a leitura dessa pergunta como pano de fundo para a atual, já que o principal problema era que eu não tinha dados de calibração.
fonte
lm(score ~ gradStudent + ... + teacherID
deveria fazê-lo.Aqui estão algumas abordagens relacionadas.
Pegue o conjunto de trabalhos marcados por mais de um professor, pois esses contêm mais informações sobre os efeitos do professor e, fora deles, os efeitos do professor e da coorte são confundidos (se houver alguma maneira de obter o efeito da coorte - talvez via GPA ou algum outro preditor, por exemplo, você poderá usar todos os dados, mas isso complicará bastante os modelos).
Rotule os alunos e os marcadores . Seja o conjunto de marcas .i=1,2,...n j=1,2,...,m yij,i=1,2,...m
Primeiro, você deve considerar seu modelo para saber como o efeito do marcador se aplica. É aditivo? É multiplicativo? Você precisa se preocupar com os efeitos de contorno (por exemplo, seria melhor um efeito aditivo ou multiplicativo em uma escala de logit)?
Imagine dois marcadores em dois papéis e imagine que o segundo marcador seja mais generoso. Digamos que o primeiro marcador daria os papéis 30 e 60. O segundo marcador tenderá a adicionar um número constante de marcas (digamos 6 marcas) a ambas? Eles tendem a adicionar porcentagens constantes (digamos 10% para ambos, ou 3 pontos versus 6 pontos)? E se o primeiro marcador der 99? - o que aconteceria então? E quanto a 0? E se o segundo marcador fosse menos generoso? o que aconteceria em 99 ou 0? (é por isso que mencionei um modelo de logit - é possível tratar as marcas como uma proporção das possíveis marcas ( ), e o efeito do marcador pode ser adicionar uma constante (por exemplo) para o logit de - ie ).pij=mij/100 p log(pij/(1−pij)
(Você não terá dados suficientes aqui para estimar a forma de generosidade e seu tamanho. Você deve escolher um modelo a partir da sua compreensão da situação. Você também precisará ignorar qualquer possibilidade de interação; você não tem os dados para isso)
Possibilidade 1 - modelo aditivo simples. Isso pode ser adequado se nenhuma marca for realmente próxima de 0 ou 100:
Considere um modelo comoE(yij)=μi+τj
Esta é essencialmente uma ANOVA de duas vias. Você precisa de restrições quanto a isso, portanto, você pode configurar uma codificação de desvio / configurar o modelo para que os efeitos do marcador sejam 0 ou configurar um modelo em que um marcador é a linha de base (cujo efeito é 0 e cujas marcas você deseja). tentará ajustar todos os outros marcadores para).
Depois, pegue os valores e ajuste a população maior de marcas .τ^j yadjkj=ykj−τ^j
Possibilidade 2: Com efeito, um tipo de idéia semelhante, mas . Aqui você pode ajustar um modelo de mínimos quadrados não-lineares ou um GLM com um link de log (eu provavelmente me inclinaria para o segundo desses dois). Novamente, você precisa de uma restrição nos s.E(yij)=μiτj τ
Então, um ajuste adequado seria dividir por .τj^
Possibilidade 3: aditivo na escala logit. Isso pode ser mais adequado se algumas marcas chegarem perto de 0 ou 100. Aparecerá aproximadamente multiplicativo para marcas muito pequenas, aditivo para marcas intermediárias e aproximadamente multiplicativo em para marcas muito altas. Você pode usar uma regressão beta ou um GLM quase binomial com link logit para ajustar-se a este modelo.1−p=(100−m)/100
fonte