Estou tentando interpretar fatores de inflação de variância usando a vif
função no pacote de R car
. A função imprime um generalizado e também . De acordo com o arquivo de ajuda , esse último valor
Para ajustar a dimensão do elipsóide de confiança, a função também imprime GVIF ^ [1 / (2 * df)] em que df é o grau de liberdade associado ao termo.
Eu não entendo o significado dessa explicação no arquivo de ajuda, portanto, não tenho certeza se devo usar ou . Para o meu modelo, esses dois valores são muito diferentes (máximo é ~ ; máximo é ~ ).
Alguém poderia me explicar qual deles devo usar e o que significa ajustar a dimensão do elipsóide de confiança?
fonte
Encontrei exatamente a mesma pergunta e tentei trabalhar. Veja minha resposta detalhada abaixo.
Primeiro de tudo, eu encontrei 4 opções produzindo valores VIF semelhantes em R:
•
corvif
comando do pacote AED,•
vif
comando do pacote veicular,•
vif
comando do pacote rms,•
vif
comando do pacote DAAG.O uso desses comandos em um conjunto de preditores que não incluem fatores / variáveis categóricas ou termos polinomiais é um passo direto. Todos os três comandos produzem a mesma saída numérica, embora o
corvif
comando do pacote AED rotule os resultados como GVIF.No entanto, normalmente, o GVIF só entra em jogo para fatores e variáveis polinomiais. Variáveis que requerem mais de 1 coeficiente e, portanto, mais de 1 grau de liberdade são normalmente avaliadas usando o GVIF. Para termos de um coeficiente, VIF é igual a GVIF.
Portanto, você pode aplicar regras práticas padrão sobre se a colinearidade pode ser um problema, como um limite de 3, 5 ou 10. No entanto, alguns cuidados podem (devem) ser aplicados (consulte: http://www.nkd-group.com/ghdash/mba555/PDF/VIF%20article.pdf ).
No caso de termos com múltiplos coeficientes, como, por exemplo, preditores categóricos, os 4 pacotes produzem resultados diferentes. Os
vif
comandos dos pacotes rms e DAAG produzem valores VIF, enquanto os outros dois produzem valores GVIF.Vamos dar uma olhada nos valores VIF dos pacotes rms e DAAG primeiro:
TNAP e ICE são preditores contínuos e Reg é uma variável categórica apresentada pelos manequins RegB para RegE. Nesse caso, RegA é a linha de base. Todos os valores de VIF são bastante moderados e, geralmente, nada para se preocupar. O problema com esse resultado é que ele é afetado pela linha de base da variável categórica. Para ter certeza de não ter um valor VIF acima de um nível aceitável, seria necessário refazer essa análise para cada nível da variável categórica que é a linha de base. Neste caso, cinco vezes.
Aplicando o
corvif
comando do pacote AED ou ovif
comando do pacote veicular, os valores GVIF são produzidos:O GVIF é calculado para conjuntos de regressores relacionados, como a para um conjunto de regressores fictícios. Para as duas variáveis contínuas TNAP e ICE, é o mesmo que os valores VIF anteriores. Para a variável categórica Reg, obtemos agora um valor GVIF muito alto, embora os valores VIF para os níveis únicos da variável categórica fossem todos moderados (como mostrado acima).
fonte
[ASK QUESTION]
no topo e faça a pergunta lá, podemos ajudá-lo adequadamente. Como você é novo aqui, convém fazer um tour , que contém informações para novos usuários.A Fox & Monette (citação original de GVIF, GVIF ^ 1 / 2df) sugere que levar o GVIF à potência de 1 / 2df torna o valor do GVIF comparável em diferentes números de parâmetros. "É análogo à raiz quadrada do fator de variação-inflação usual" (de An R e S-Plus Companion a Applied Regression, de John Fox). Então, sim, ajustá-lo e aplicar a "regra de ouro" usual do VIF parece razoável.
fonte