As contagens zero precisam ser ajustadas para um teste de razão de verossimilhança de modelos poisson / loglinear?

9

Se houver 0 na tabela de contingência e estivermos ajustando modelos poisson / loglinear aninhados (usando a glmfunção de R ) para um teste de razão de verossimilhança, precisamos ajustar os dados antes de ajustar os modelos glm (por exemplo, adicione 1/2 a todos as contagens)? Obviamente, alguns parâmetros não podem ser estimados sem algum ajuste, mas como o ajuste / falta de ajuste afeta o teste LR?

BR1
fonte
presumivelmente, a glmrotina seria ruim se não pudesse lidar com zeros. tentaste?
shabbychef
11
Sim, ele não trava, mas, dependendo da fórmula (por exemplo, em um modelo saturado), alguns dos parâmetros podem ter efetivamente erros padrão infinitos. Minha pergunta é se isso é um problema ao fazer um teste de razão de verossimilhança. Você ainda pode calcular uma probabilidade, mesmo que alguns parâmetros não sejam estimados; esses parâmetros simplesmente não contribuirão para a probabilidade. Qual é a prática padrão e por quê?
BR1

Respostas:

7

Um dos poderes da modelagem de regressão geralmente é que você pode suavizar áreas sem dados - embora, como você tenha notado, ocasionalmente haja problemas na estimativa de parâmetros. Eu sugeriria que, se você está recebendo erros padrão infinitos, é hora de reconsiderar sua abordagem de modelagem.

Uma observação particular de cautela: existe uma diferença entre "Não ter contagens" em um determinado estrato e é impossível que haja contagens nesses estratos. Por exemplo, imagine que você esteja trabalhando em um estudo de distúrbios psicológicos para a Marinha dos EUA entre 2000 e 2009, e tenha termos de regressão binária para "É uma mulher" e "Serve em um submarino". Um modelo de regressão pode ser capaz de estimar efeitos em que ambas as variáveis ​​= 1, apesar de ter uma contagem zero em que ambas = 1. No entanto, essa inferência não seria válida - tal circunstância é impossível. Esse problema é chamado de "não positividade" e, ocasionalmente, é um problema em modelos altamente estratificados.

Fomite
fonte
@ skyguy94 Por incrível que pareça, eu não sabia - acabei de me esquecer de observar o uso de um conjunto de dados retrospectivos>. <. Editado para refletir isso.
fomite
Re: "Um modelo de regressão pode ser capaz de estimar efeitos onde ambas as variáveis ​​= 1 ou interações entre as duas " - não acho que isso seja verdade. Se você tiver dois preditores binários que nunca são '1' juntos, a interação é constante (sempre é '0'), portanto, seu efeito não é identificado.
Macro
@ Macro Você está certo, estou editando um pouco. Eu estava pensando em termos em que eles não são indicadores binários.
Fomite
11
(+1) Portanto, problemas com a não plausibilidade do caso em que ambos = 1 à parte, a estimativa baseada no modelo seria apenas a soma dos dois efeitos marginais, que sabemos que podem ser muito enganadores por si só :)
Macro