Como suposição de regressão linear, a normalidade da distribuição do erro às vezes é erroneamente "estendida" ou interpretada como a necessidade de normalidade de y ou x.
É possível construir um cenário / conjunto de dados em que X e Y não sejam normais, mas o termo do erro é e, portanto, as estimativas de regressão linear obtidas são válidas?
Respostas:
Expandindo o comentário de Hong Oois com uma imagem. Aqui está uma imagem de um conjunto de dados em que nenhum dos marginais é normalmente distribuído, mas os resíduos ainda são, portanto, as suposições da regressão linear ainda são válidas:
A imagem foi gerada pelo seguinte código R:
fonte