Se houver 0 na tabela de contingência e estivermos ajustando modelos poisson / loglinear aninhados (usando a glm
função de R ) para um teste de razão de verossimilhança, precisamos ajustar os dados antes de ajustar os modelos glm (por exemplo, adicione 1/2 a todos as contagens)? Obviamente, alguns parâmetros não podem ser estimados sem algum ajuste, mas como o ajuste / falta de ajuste afeta o teste LR?
9
glm
rotina seria ruim se não pudesse lidar com zeros. tentaste?Respostas:
Um dos poderes da modelagem de regressão geralmente é que você pode suavizar áreas sem dados - embora, como você tenha notado, ocasionalmente haja problemas na estimativa de parâmetros. Eu sugeriria que, se você está recebendo erros padrão infinitos, é hora de reconsiderar sua abordagem de modelagem.
Uma observação particular de cautela: existe uma diferença entre "Não ter contagens" em um determinado estrato e é impossível que haja contagens nesses estratos. Por exemplo, imagine que você esteja trabalhando em um estudo de distúrbios psicológicos para a Marinha dos EUA entre 2000 e 2009, e tenha termos de regressão binária para "É uma mulher" e "Serve em um submarino". Um modelo de regressão pode ser capaz de estimar efeitos em que ambas as variáveis = 1, apesar de ter uma contagem zero em que ambas = 1. No entanto, essa inferência não seria válida - tal circunstância é impossível. Esse problema é chamado de "não positividade" e, ocasionalmente, é um problema em modelos altamente estratificados.
fonte