Meu entendimento é que mesmo a regressão não causa causalidade. Só pode dar associação entre as variáveis y ex variáveis e possivelmente uma direção. Estou correcto? Muitas vezes encontrei frases semelhantes a "x prediz y", mesmo na maioria dos livros didáticos e em várias páginas de cursos on-line. E você costuma chamar os regressores como preditores ey como resposta.
- Quão justo é usá-lo para regressão linear?
- E quanto à regressão logística? (se eu tiver um limite t com o qual posso comparar a probabilidade?)
Respostas:
Não há problema em usar a palavra "prever".
É importante reconhecer que as previsões não estão relacionadas à causalidade. Considere um caso em que a maioria das pessoas que morrem na sala de emergência de um hospital morre de ataque cardíaco. Se você ouvir que um paciente morreu, mas não sabia a causa, poderia prever que provavelmente foi por um ataque cardíaco, porque sabe que os ataques cardíacos são responsáveis por> 50%. Você está fazendo uma previsão, mas está prevendo uma causa desconhecida a partir de um efeito conhecido. Além disso, a previsão neste exemplo é categórica, portanto é análoga à regressão logística. (A analogia é provavelmente mais forte para a regressão logística multinomial , mas isso não importa aqui.)
Pelo que vale, as previsões não precisam estar relacionadas a nenhuma conexão causal direta. Você pode fazer uma previsão com base em uma correlação falsa, desde que o relacionamento seja confiável. Considere prever a altura desconhecida de um gêmeo idêntico com base no irmão do gêmeo. Nesse caso, as duas alturas são efeitos de um conjunto de causas comuns (genética e ambiente compartilhados). A altura de nenhum dos gêmeos é uma causa ou um efeito do outro. No entanto, você pode fazer previsões muito boas nessa situação.
fonte