Desenvolvi um modelo de logit para ser aplicado a seis conjuntos diferentes de dados transversais. O que estou tentando descobrir é se há alterações no efeito substantivo de uma determinada variável independente (IV) na variável dependente (DV) que controla outras explicações em momentos diferentes e ao longo do tempo.
Minhas perguntas são:
- Como avalio o aumento / diminuição do tamanho na associação entre IV e DV?
- Posso simplesmente observar as diferentes magnitudes (tamanhos) dos coeficientes nos modelos ou preciso passar por outro processo?
Se eu precisar fazer outra coisa, o que é e pode ser feito / como faço no SPSS?
Além disso, dentro de um único modelo,
- Posso comparar o tamanho relativo de variáveis independentes com base em pontuações não padronizadas se todas estiverem codificadas de 0 a 1 ou preciso convertê-las em pontuações padronizadas?
- Existem problemas envolvidos com pontuações padronizadas?
Respostas:
Vou me concentrar principalmente em suas três primeiras perguntas. As respostas curtas são: (1) você precisa comparar o efeito do IV no DV para cada período de tempo, mas (2) apenas comparar as magnitudes pode levar a conclusões erradas e (3) existem várias maneiras de fazer isso, mas não há consenso sobre qual deles está correto.
Abaixo, descrevo por que você não pode simplesmente comparar magnitudes de coeficientes e apontar algumas soluções que foram pensadas até agora.
Segundo Allison (1999), diferentemente do OLS, os coeficientes de regressão logística são afetados pela heterogeneidade não observada, mesmo quando essa heterogeneidade não está relacionada à variável de interesse.
Quando você ajusta uma regressão logística como:
Isso ocorre porque as comparações podem produzir conclusões incorretas se a variação não observada diferir entre grupos, países ou períodos. Ambas as comparações usando modelos diferentes e usando termos de interação no mesmo modelo sofrem com esse problema. Além do logit, isso também se aplica a seus primos probit, clog-log, cauchit e, por extensão, a modelos discretos de risco de tempo estimados usando essas funções de link. Os modelos de logit ordenados também são afetados por ele.
Williams (2009) argumenta que a solução é modelar a variação não observada por meio de um modelo de escolha heterogêneo (também conhecido como modelo de escala de localização) e fornece um complemento Stata chamado
oglm
para isso (Williams 2010). Em R, modelos de escolha heterogêneos podem ser ajustados com ahetglm()
função doglmx
pacote, disponível através do CRAN. Ambos os programas são muito fáceis de usar. Por fim, Williams (2009) menciona aPLUM
rotina do SPSS para ajustar esses modelos, mas nunca a usei e não posso comentar como é fácil usá-la.No entanto, há pelo menos um documento de trabalho por aí mostrando que comparações usando modelos de escolha heterogênea podem ser ainda mais tendenciosas se a equação de variância for mal especificada ou se houver erro de medição.
Mood (2010) lista outras soluções que não envolvem modelagem da variância, mas usam comparações de mudanças de probabilidade previstas.
Aparentemente, é uma questão que não está resolvida, e muitas vezes vejo trabalhos em conferências da minha área (Sociologia) apresentando soluções diferentes para isso. Aconselho você a olhar para o que as pessoas em seu campo fazem e depois decidir como lidar com isso.
Referências
fonte
Existem alterações nos conjuntos de dados? Eu posso responder isso sem ver os dados! Sim. Tem. Quão grandes são eles? Essa é a chave. Para mim, a maneira de ver é olhando. Você terá odds ratio para cada variável independente para cada conjunto de dados - eles são diferentes nas maneiras pelas quais as pessoas acham interessantes? Agora, é verdade que cada um terá um erro padrão e assim por diante, e provavelmente existem maneiras de ver se eles são estatisticamente significativamente diferentes um do outro, mas isso é realmente uma pergunta interessante? Se for, uma maneira de testá-lo facilmente com o software seria combinar todos os estudos e incluir "estudo" como outra variável independente. Você pode até testar interações, se quiser. Se você quer fazer isso depende de suas perguntas substantivas.
Quanto à comparação de variáveis dentro de um modelo, o principal problema com pontuações padronizadas é que elas são padronizadas em sua amostra específica. Portanto, as estimativas de parâmetros e assim por diante são, então, em termos de desvios padrão das variáveis em sua amostra específica. Mesmo que sua amostra seja realmente uma amostra aleatória de alguma população, ela terá (ligeiramente) desvios padrão diferentes de outras amostras aleatórias. Isso torna as coisas confusas.
O outro problema é o que a questão do "tamanho relativo" significa. Se seus IVs são coisas bem compreendidas, você pode comparar os ORs entre os intervalos que significam alguma coisa.
fonte
Guilherme está no dinheiro aqui. Embora as outras respostas sejam úteis, observe que a regressão logística (e toda regressão não-linear como Poisson) é fundamentalmente diferente da regressão linear. Pode haver problemas sérios com o fator de escala do logit ao executar a mesma análise em seis conjuntos de dados diferentes e depois executar essa análise no conjunto de dados combinado. Mudanças nos coeficientes podem não ter nada a ver com diferenças significativas (mesmo que sejam estatisticamente significativas ou importantes). Eles poderiam ter tudo a ver com heterogeneidade não observada nas amostras. Você absolutamente tem que testar para isso. Muitos (se não a maioria) dos pesquisadores nas áreas de ciências sociais e políticas ignoram isso. Guilherme dá os artigos seminais sobre isso que recomendo a todos. As sugestões de Peters são práticas, mas simplesmente codificar uma variável dummy para a amostra da qual os dados vêm não abordará essa heterogeneidade no fator de escala. Você pode fazer isso em regressão linear e a heterogeneidade não deve afetar seus coeficientes, mas aqui pode.
Um outro aspecto do efeito da heterogeneidade não observada exclusiva da regressão logit vs. linear é o efeito de diferentes regressores em cada conjunto de dados. Se você não tiver as mesmas variáveis ou provavelmente se elas forem medidas de maneira diferente, você terá uma forma de viés de variável omitida. Diferentemente da regressão linear, uma variável omitida ortogonal ao seu regressor principal ainda pode influenciar sua estimativa. Como Cramer coloca:
Cramer também aponta que, embora as estimativas do coeficiente sejam tendenciosas para baixo ao omitir uma variável, as derivadas parciais não. Isso é bastante complicado e você deve ler o artigo para obter uma explicação mais lúcida - o ponto principal é que não olhe exclusivamente para o log-odds ou odds ratio. Considere probabilidades e derivativos previstos; consulte o comando margens no Stata para obter mais detalhes. JD Long tem um artigo que entra em detalhes aqui.
Por fim, há vários artigos que você pode pesquisar no Google para discutir os termos de interação nos modelos de logit. Meu entendimento é que considere o coeficiente do logit em uma interação como um guia, mas não definitivo, especialmente se você preferir ver os coeficientes como razões de chances exponenciadas. Examinar as probabilidades previstas e o efeito marginal médio é melhor (novamente, consulte a documentação no comando de margem da Stata para logit, mesmo se você usar o SPSS, isso ainda será útil).
Eu não estou familiarizado o suficiente com o SPSS para saber como esse pacote pode lidar com esses problemas, mas vou dizer o seguinte: quando você se deparar com questões estatísticas mais profundas como essa, é uma indicação de que é hora de você mudar para uma situação mais pacote flexível e sofisticado como Stata ou R.
fonte
Outra ferramenta que pode ser útil é o coeficiente de regressão padronizado, ou pelo menos uma pseudo-versão grosseira e pronta. Você pode obter uma dessas versões multiplicando o coeficiente obtido pelo desvio padrão do preditor. (Existem outras versões e alguns debates sobre a melhor, por exemplo, consulte Menard 2002, Análise de regressão logística aplicada ( Google books )). Isso fornecerá uma maneira de avaliar a força do efeito entre os estudos.
fonte