Poder explicativo de uma variável

8

Eu tenho um modelo de regressão linear simples. O que eu quero calcular é quão "importante" cada uma das minhas variáveis ​​de entrada é, ou seja, fazer uma declaração algo como isto:

"60% do poder preditivo neste modelo vem da variável var1, onde var2 e var3 têm 30% e 10%" respectivamente "

O que preciso fazer para calcular essas porcentagens?

user333
fonte
3
O que exatamente você quer dizer com "poder preditivo"? Por exemplo, var3 pode ter uma correlação extremamente alta com a variável dependente em uma amostra, mas pode ser necessário fazer previsões em que var3 se desvia substancialmente dos valores atingidos na amostra, introduzindo uma enorme incerteza na previsão. OTOH, var1 e var2 podem individualmente ter correlações ruins com o DV, mas juntos podem funcionar bem para as previsões pretendidas. Isso indica que a medição do "poder preditivo" requer um contexto de previsão específico além do modelo.
whuber

Respostas:

10

O pacote relaimpo R faz exatamente o que você deseja fazer e também fornece ICs de inicialização ao avaliar a contribuição relativa do preditor individual para o geral .R2

Um exemplo de uso pode ser encontrado no final deste tutorial: Introdução a uma abordagem moderna à regressão .

chl
fonte
+1 para uma resposta fácil para perder a pergunta formulada. Você deve acrescentar que este trabalho apenas se o número de preditor é menor do que, digamos, 50.
user603
@chl Os resultados (= ordem de importância dos regressores) do RelaImpo variam drasticamente dos resultados dos valores beta não padronizados. Eu me pergunto por que é isso - todos os meus 14 regressores têm a mesma métrica (faixa de 0 a 3) e, embora as médias e os desvios padrão variem drasticamente entre os sintomas, os pesos beta não padronizados devem fornecer resultados aproximadamente semelhantes aos do RelaImpo, ou não? Obrigado.
Torvon