Em muitas configurações, estamos interessados em estimar um modelo com uma variável dependente fracionária. Por exemplo, Papke e Wooldridge (1996) http://faculty.smu.edu/millimet/classes/eco6375/papers/papke%20wooldridge%201996.pdf consideram as taxas de participação do plano 401 (k), onde a taxa é definida como . Os autores então desenvolvem um método GLM para estimar esses modelos. Olhando para a literatura de dados de contagem, imagino que não se deva executar uma regressão de Poisson de contas no mesmo conjunto de regressores e como funcionários de compensação . Isso depende potencialmente do número absoluto de contas ?
Isso é diferente de uma duplicata sugerida. Qual modelo de regressão é o mais apropriado para usar com dados de contagem? como minha pergunta discute o local correto do deslocamento / denominador.
fonte
Respostas:
Uma razão para não usar a regressão de Poisson aqui é que, como cada funcionário pode ter no máximo uma conta, o número de contas é limitado pelo número de funcionários. Uma distribuição de Poisson permitiria probabilidade diferente de zero para o número de contas que excedem o número de funcionários. Meu entendimento é que, embora as regressões de Poisson sejam robustas a muitas violações de suposições, pelo menos você perderia a eficiência ao usar uma regressão de Poisson em comparação com algo mais apropriado.
A questão então deveria ser: uma regressão binomial não seria mais apropriada? (Supondo a mesma taxa de participação para cada funcionário, o número de planos deve ser distribuído como que é o número de funcionários.) IIRC, o motivo pelo qual uma regressão binomial não pode ser empregada neste caso é que o número de funcionários não é conhecido; somente a taxa de participação em si é conhecida. Isso exclui a regressão binomial - e também descartaria a regressão de Poisson com um deslocamento, mesmo que fosse apropriado.p y Binomial(n,p) n
fonte