Como visualizar um modelo de regressão múltipla ajustado?

43

Atualmente, estou escrevendo um artigo com várias análises de regressão múltipla. Embora visualizar a regressão linear univariada seja fácil por meio de gráficos de dispersão, fiquei pensando se existe alguma maneira de visualizar várias regressões lineares?

Atualmente, estou apenas plotando gráficos de dispersão, como variável dependente vs. 1ª variável independente, depois vs. 2ª variável independente, etc. Eu realmente aprecio quaisquer sugestões.

Shawn Wang
fonte
6
Uma possibilidade: gráficos de variáveis ​​adicionados
Glen_b 20/10
1
De possível interesse, bem como: Previsto por parcela residual em R .
chl
1
Veja o effectspacote emR
Peter Flom - Reinstate Monica
3
Acho que deveria ter pedido esse esclarecimento primeiro: você quer dizer regressão linear com múltiplos preditores (x's, IVs) - ou seja, regressão múltipla ou você quer dizer regressão linear com múltiplas respostas (y's, DVs) - ou seja, regressão multivariada ?
Glen_b

Respostas:

25

Não há nada de errado com sua estratégia atual. Se você tiver um modelo de regressão múltipla com apenas duas variáveis ​​explicativas, poderá tentar fazer um gráfico 3D-ish que exiba o plano de regressão previsto, mas a maioria dos softwares não facilita isso. Outra possibilidade é usar um coplot (veja também: coplot em R ou neste pdf ), que pode representar três ou até quatro variáveis, mas muitas pessoas não sabem como lê-las. Essencialmente, no entanto, se você não tiver nenhuma interação, o relacionamento marginal previsto entre e será o mesmo que o condicional previstoxjyrelacionamento (mais ou menos algum deslocamento vertical) em qualquer nível específico de suas outras variáveis . Portanto, você pode simplesmente definir todas as outras variáveis com suas médias e encontrar a linha prevista e plotar essa linha em um gráfico de dispersão de pares. Além disso, você terminará com tais parcelas, embora possa não incluir algumas se achar que elas não são importantes. (Por exemplo, é comum ter um modelo de regressão múltipla com uma única variável de interesse e algumas variáveis ​​de controle e apresentar apenas o primeiro gráfico desse tipo). xxy^=β^0++β^jxj++β^px¯p(xj,y)p

Por outro lado, se você faz ter interações, então você deve descobrir qual das variáveis interagindo você está mais interessado em e traçar a relação prevista entre essa variável e a variável resposta, mas com várias linhas na mesma trama. A outra variável de interação é configurada em níveis diferentes para cada uma dessas linhas. Os valores típicos seriam a média e 1 DP da variável em interação. Para deixar isso mais claro, imagine que você tenha apenas duas variáveis, e , e tenha uma interação entre elas, e que seja o foco do seu estudo, e faça um gráfico único com estas três linhas:±x1x2x1

y^=β^0+β^1x1+β^2(x¯2sx2)+β^3x1(x¯2sx2)y^=β^0+β^1x1+β^2x¯2 +β^3x1x¯2y^=β^0+β^1x1+β^2(x¯2+sx2)+β^3x1(x¯2+sx2)
- Reinstate Monica
fonte
9

Aqui está uma ferramenta interativa baseada na Web para plotar resultados de regressão em três dimensões .

Este gráfico 3D trabalha com uma variável dependente e duas variáveis ​​explicativas. Você também pode definir o intercepto como zero (ou seja, remover o intercepto da equação de regressão).

Os gráficos requerem um navegador compatível com WebGL. As versões mais recentes de todos os principais navegadores de desktop oferecem suporte ao WebGL.

insira a descrição da imagem aqui

Android 3D
fonte
O site está fora do ar agora - recebo uma página de destino do GoDaddy
spinup
4

Para visualizar o modelo , e não os dados, o JMP usa um gráfico interativo de "perfilador". Aqui está uma visão estática.

insira a descrição da imagem aqui

E aqui está um link para uma visão dinâmica .

É semelhante à sua ideia de gráfico de dispersão e pode ser combinada com ela. A idéia é que cada quadro mostre uma fatia do modelo para as variáveis ​​X e Y correspondentes, com as outras variáveis ​​X mantidas constantes nos valores indicados. Na versão interativa, os valores X podem ser alterados arrastando as linhas verticais vermelhas.

Divulgação: sou desenvolvedor JMP, portanto, não tome isso como um endosso imparcial.

xan
fonte
2
Não é crucial que você plote os resíduos da variável dependente com os resíduos dos preditores? Eu pensei que deveria ser, pois esses representam os relacionamentos reais entre suas variáveis, mas isso raramente parece recomendado.
Agus Camacho
1
@AgusCamacho, se você ainda estiver interessado nisso, faça uma nova pergunta.
gung - Restabelece Monica