Quando alguém diz que o desvio residual / df deve ~ 1 para um modelo de Poisson, quão aproximado é aproximado?

16

Eu sempre vi o conselho para verificar se um ajuste do modelo de Poisson está ou não disperso em excesso, envolvendo a divisão do desvio residual pelos graus de liberdade. A proporção resultante deve ser "aproximadamente 1".

A questão é de qual faixa estamos falando para "aproximado" - qual é a proporção que deve acionar alarmes para considerar formas alternativas de modelos?

Fomite
fonte
2
Não é uma resposta para essa pergunta interessante, mas o que farei com frequência é executar vários modelos (por exemplo, Poissson, NB, talvez versões com inflação zero) e compará-los - tanto em medidas do tipo AIC quanto em valores previstos.
Peter Flom - Restabelece Monica
Esse link pode ser do seu interesse. Especialmente a seção "Critérios para avaliar a qualidade do ajuste".
@Procrastinator O link é um exemplo perfeito do que estou falando: "Então, se o nosso modelo se encaixa bem nos dados, a proporção de Deviance para DF, Valor / DF, deve ser de cerca de um. Valores grandes de proporção podem indicar modelo especificação incorreta ou variável de resposta super dispersa; proporções inferiores a uma também podem indicar especificação incorreta do modelo ou variável de resposta sub dispersa ". Qual é o alcance de "cerca de 1"? 0,99 a 1,01? 0,75 a 2?
Fomite 21/09/12
O r-bloggers.com/… também possui algumas informações sobre como responder a essa pergunta, embora a resposta do @ StasK a cubra bem o suficiente.
voa

Respostas:

14

χk22kχk22kχk2/k2/kχ1002χ10,0002

StasK
fonte
11
χk2/k2/k
amazon.com/… . Desculpe ser um idiota, mas essa é uma distribuição de referência em inferência estatística; se você não entender, não deve trabalhar com modelos lineares generalizados, como Poisson.
StasK
2
Para referência futura, você pode, em vez do prefixo / pedido de desculpas por ser um idiota, apenas declarar as informações e uma referência. Provavelmente, pouparia você digitando e faria você parecer menos idiota, o que pode ser uma experiência nova.
Baxx
Veja editar e a referência da Wikipedia. Ofereci algumas centenas de respostas ao longo de alguns anos, então admito que é um pouco difícil para mim ter uma experiência realmente nova.
StasK
7

Assintoticamente, o desvio deve ser qui-quadrado distribuído com média igual aos graus de liberdade. Portanto, divida-o por seus graus de liberdade e você deverá obter cerca de 1 se os dados não estiverem dispersos demais. Para obter um teste adequado, basta procurar o desvio nas tabelas do qui-quadrado - mas observe (a) que a distribuição do quadrado do qui é uma aproximação & (b) que um valor alto pode indicar outros tipos de falta de ajuste (talvez por isso 'em torno de 1' é considerado bom o suficiente para o trabalho do governo).

Scortchi - Restabelecer Monica
fonte