Atualmente, estou escrevendo um artigo com várias análises de regressão múltipla. Embora visualizar a regressão linear univariada seja fácil por meio de gráficos de dispersão, fiquei pensando se existe alguma maneira de visualizar várias regressões lineares?
Atualmente, estou apenas plotando gráficos de dispersão, como variável dependente vs. 1ª variável independente, depois vs. 2ª variável independente, etc. Eu realmente aprecio quaisquer sugestões.
regression
data-visualization
multiple-regression
Shawn Wang
fonte
fonte
effects
pacote emR
Respostas:
Não há nada de errado com sua estratégia atual. Se você tiver um modelo de regressão múltipla com apenas duas variáveis explicativas, poderá tentar fazer um gráfico 3D-ish que exiba o plano de regressão previsto, mas a maioria dos softwares não facilita isso. Outra possibilidade é usar um coplot (veja também: coplot em R ou neste pdf ), que pode representar três ou até quatro variáveis, mas muitas pessoas não sabem como lê-las. Essencialmente, no entanto, se você não tiver nenhuma interação, o relacionamento marginal previsto entre e será o mesmo que o condicional previstoxj y relacionamento (mais ou menos algum deslocamento vertical) em qualquer nível específico de suas outras variáveis . Portanto, você pode simplesmente definir todas as outras variáveis com suas médias e encontrar a linha prevista e plotar essa linha em um gráfico de dispersão de pares. Além disso, você terminará com tais parcelas, embora possa não incluir algumas se achar que elas não são importantes. (Por exemplo, é comum ter um modelo de regressão múltipla com uma única variável de interesse e algumas variáveis de controle e apresentar apenas o primeiro gráfico desse tipo). x x y^=β^0+⋯+β^jxj+⋯+β^px¯p (xj,y) p
Por outro lado, se você faz ter interações, então você deve descobrir qual das variáveis interagindo você está mais interessado em e traçar a relação prevista entre essa variável e a variável resposta, mas com várias linhas na mesma trama. A outra variável de interação é configurada em níveis diferentes para cada uma dessas linhas. Os valores típicos seriam a média e 1 DP da variável em interação. Para deixar isso mais claro, imagine que você tenha apenas duas variáveis, e , e tenha uma interação entre elas, e que seja o foco do seu estudo, e faça um gráfico único com estas três linhas:± x1 x2 x1
fonte
Aqui está uma ferramenta interativa baseada na Web para plotar resultados de regressão em três dimensões .
Este gráfico 3D trabalha com uma variável dependente e duas variáveis explicativas. Você também pode definir o intercepto como zero (ou seja, remover o intercepto da equação de regressão).
Os gráficos requerem um navegador compatível com WebGL. As versões mais recentes de todos os principais navegadores de desktop oferecem suporte ao WebGL.
fonte
Para visualizar o modelo , e não os dados, o JMP usa um gráfico interativo de "perfilador". Aqui está uma visão estática.
E aqui está um link para uma visão dinâmica .
É semelhante à sua ideia de gráfico de dispersão e pode ser combinada com ela. A idéia é que cada quadro mostre uma fatia do modelo para as variáveis X e Y correspondentes, com as outras variáveis X mantidas constantes nos valores indicados. Na versão interativa, os valores X podem ser alterados arrastando as linhas verticais vermelhas.
Divulgação: sou desenvolvedor JMP, portanto, não tome isso como um endosso imparcial.
fonte