Três pontos sobre a regressão de Poisson x Normal, todos relativos à especificação do modelo:
Efeito das mudanças nos preditores
Com um preditor contínuo como a pontuação do teste de matemática, a regressão de Poisson (com o link de log usual) implica que uma alteração de unidade no preditor leva a uma alteração percentual no número de prêmios, ou seja, mais 10 pontos no teste de matemática estão associados a, por exemplo, 25% mais prêmios. Isso depende do número de prêmios que o aluno já está previsto. Por outro lado, a regressão normal associa mais 10 pontos a um valor fixo, digamos mais 3 prêmios em todas as circunstâncias. Você deve estar satisfeito com essa suposição antes de usar o modelo que a cria. (fwiw eu acho que é muito razoável, módulo o próximo ponto.)
Lidar com alunos sem prêmios
A menos que haja realmente muitos prêmios distribuídos por muitos estudantes, sua contagem de prêmios será geralmente bastante baixa. Na verdade, eu previa inflação zero, ou seja, a maioria dos estudantes não recebe nenhum prêmio, então muitos zeros e alguns bons alunos recebem alguns prêmios. Isso mexe com as suposições do modelo de Poisson e é pelo menos tão ruim quanto o modelo normal.
Se você tiver uma quantidade razoável de dados, um modelo 'inflado a zero' ou 'obstáculo' seria natural. São dois modelos interligados: um para prever se o aluno recebe algum prêmio e outro para prever quantos ela recebe, se recebe algum (geralmente alguma forma de modelo de Poisson). Eu esperaria que toda a ação estivesse no primeiro modelo.
Exclusividade do prêmio
Finalmente, um pequeno ponto sobre prêmios. Se os prêmios são exclusivos, ou seja, se um aluno recebe o prêmio e nenhum outro aluno pode receber o prêmio, seus resultados são acoplados; uma contagem para o aluno a diminui a contagem possível de todas as outras. Se vale a pena se preocupar com isso depende da estrutura dos prêmios e do tamanho da população estudantil. Eu o ignoraria em um primeiro passo.
Em conclusão, Poisson domina confortavelmente o Normal, exceto por contagens muito grandes, mas verifique as suposições do Poisson antes de se apoiar fortemente em inferência e esteja preparado para passar para uma classe de modelo um pouco mais complexa, se necessário.