Esta pergunta foi feita aqui, mas ninguém deu uma boa resposta. Então eu acho que é uma boa idéia trazê-lo novamente e também gostaria de adicionar mais alguns comentários / perguntas.
A primeira pergunta é qual é a diferença entre "modelagem de caminho PLS" e "regressão PLS"? Para torná-lo mais geral, o que são modelagem de equações estruturais (SEM), modelagem de caminhos e regressão? Para meu entendimento, a regressão se concentra mais na previsão, enquanto o foco no SEM está na relação entre resposta e preditores, e a modelagem de caminhos é um caso especial de SEM?
Minha segunda pergunta é quão confiável é o PLS? Recentemente, foi objeto de muitas críticas, como destacado em Rönkkö et al. 2016 e Rönkkö et al. 2015 que leva à rejeição de papéis com base no PLS em revistas de grande nível, como Journal of Operations Management ( aqui é a nota do editor da revista):
Estamos rejeitando praticamente todos os manuscritos baseados em PLS, porque concluímos que o PLS foi, sem exceção, a abordagem de modelagem incorreta nos tipos de modelos que os pesquisadores de OM usam .
Devo observar que meu campo é espectroscopia, nem administração / psicologia nem estatística. Nos artigos acima, os autores estão falando mais sobre o PLS como método SEM, mas para mim, suas críticas também se aplicam à regressão do PLS.
Respostas:
Nenhum, eles são sinônimos.
SEM é uma forma de regressão. Regressão é qualquer método que correlaciona variáveis independentes e dependentes e inclui métodos que usam várias variáveis tratadas como entidades separadas. O SEM usa especificamente relações matemáticas entre as variáveis para restringir o modelo final; no caso do PLS, essa é a covariância. Meu entendimento é que a modelagem de caminho é um termo específico do domínio (não meu, eu sou um espectroscopista como você).
Uma excelente refutação é encontrada em Henseler et al. 2013 Crenças comuns e realidade sobre PLS . Uma das principais preocupações de Rönkkö et al. é que o PLS não teve um ótimo desempenho em algumas situações que assumem um fator latente comum. De fato, o PLS foi projetado para lidar com vários fatores latentes, uma situação muito mais comum no mundo real.
Quão confiável? Para espectroscopia, é uma excelente ferramenta, mas tem suas limitações. Ele corre o risco de se ajustar demais, pois pode criar modelos complexos que capturam contribuições de vários fatores subjacentes. Por esse motivo, ele precisa ser usado com cuidado e a validação externa apropriada é essencial, mas essas advertências se aplicam a todas as ferramentas de construção de modelos. Trabalho principalmente em conjuntos de dados do mundo real há 2 décadas e não encontrei nenhum conjunto de dados experimental que tivesse apenas um fator comum subjacente à variável dependente (nem com base em dados nem na teoria científica).
fonte