Existem várias perguntas que falam dos méritos relativos de vários métodos para avaliar a importância dos preditores de regressão, por exemplo, este .
Percebi que, neste comentário, @gung refere-se à prática como uma "idéia equivocada", vinculando-se a essa resposta em apoio a essa afirmação. O parágrafo final da resposta é a parte relevante.
Sinto que esta questão merece uma pergunta própria e também estou um pouco insegura sobre alguns aspectos do raciocínio. O segmento mais importante do parágrafo em questão vai
a menos que r verdadeiro seja exatamente 0, o r estimado é impulsionado em grande parte pelo intervalo de valores covariáveis que são usados.
Isso equivale a dizer que não devemos usar coeficientes padronizados para avaliar a importância, porque podemos ter amostrado aleatoriamente um intervalo restrito de valores e um intervalo mais amplo de valores ? Então, quando padronizamos esse problema, não desapareceu e acabamos pensando espiritualmente que é um preditor mais fraco que ?
Por que o problema desaparece se o verdadeiro é exatamente 0?
Como outros métodos (por exemplo, olhando coeficientes semipartiais) eliminam esse problema?
fonte
Respostas:
A resposta de Gungs é, a meu ver, uma crítica à idéia de comparar a força relativa de diferentes variáveis em uma análise empírica sem ter um modelo em mente como essas variáveis interagem ou como é a distribuição conjunta (verdadeira) de todas as variáveis relevantes. Pense no exemplo da importância das menções de altura e peso do atleta. Ninguém pode provar que, por exemplo, uma regressão linear aditiva é uma boa aproximação da função de expectativa condicional ou, em outras palavras, altura e peso podem ser importantes de uma maneira muito complicada para o desempenho do atleta. Você pode executar uma regressão linear incluindo as duas variáveis e comparar os coeficientes padronizados, mas não sabe se os resultados realmente fazem sentido.
Para dar um exemplo do Mickey Mouse, olhando para os escaladores esportivos (meus esportes favoritos), aqui está uma lista dos principais escaladores do sexo masculino, de acordo com alguma medida de desempenho obtida no site 8a.nu, com informações sobre altura, peso e ano de nascimento (apenas aqueles com informações disponíveis). Padronizamos previamente todas as variáveis para podermos comparar diretamente a associação entre uma alteração de desvio padrão nos preditores e uma alteração de desvio padrão na distribuição de desempenho. Excluindo a ilustração o número um, Adam Ondra, de altura incomum, obtemos o seguinte resultado. :
Ignorando erros padrão, etc., parece que o peso é mais importante que a altura ou igualmente importante. Mas alguém poderia argumentar que os escaladores se tornaram melhores com o tempo. Talvez devêssemos controlar os efeitos da coorte, por exemplo, oportunidades de treinamento através de melhores instalações internas? Vamos incluir o ano de nascimento!
Agora, descobrimos que ser jovem e ser pequeno é mais importante do que ser esbelto. Mas agora outra pessoa poderia argumentar que isso vale apenas para os melhores escaladores? Poderia fazer sentido comparar os coeficientes padronizados em toda a distribuição de desempenho (por exemplo, através de regressão quantílica). E, claro, pode ser diferente para as alpinistas femininas, que são muito menores e mais esbeltas. Ninguém sabe.
Este é um exemplo do Mickey Mouse do que eu acho que se refere ao gung. Não sou tão cético, acho que pode fazer sentido olhar para os coeficientes padronizados, se você acha que especificou o modelo certo ou que a separabilidade aditiva faz sentido. Mas isso depende tantas vezes da questão em questão.
Em relação às outras questões:
Sim, acho que você poderia dizer isso assim. O "intervalo mais amplo de valores X2" pode surgir através do viés de variável omitido , incluindo variáveis importantes correlacionadas com X1, mas omitindo aquelas que estão correlacionadas com X2.
Outros modelos, como coeficientes semipartiais, enfrentam o mesmo problema. Se o seu conjunto de dados for grande o suficiente, você pode fazer, por exemplo, regressão não paramétrica e tentar estimar a distribuição conjunta completa sem suposições sobre a forma funcional (por exemplo, separabilidade aditiva) para justificar o que você está fazendo, mas isso nunca é uma prova.
Em resumo, acho que pode fazer sentido comparar coeficientes padronizados ou semipartiais, mas isso depende e você precisa raciocinar a si mesmo ou a outras pessoas por que acha que faz sentido.
fonte