Eu tenho um conjunto de dados que representa decaimento exponencial. Eu gostaria de ajustar uma função exponencial a esses dados. Eu tentei log transformando a variável de resposta e, em seguida, usando menos quadrados para ajustar uma linha; usando um modelo linear generalizado com uma função de link de log e uma distribuição gama em torno da variável de resposta; e usando mínimos quadrados não lineares. Recebo uma resposta diferente para meus dois coeficientes em cada método, embora sejam todos semelhantes. Onde eu tenho confusão, não tenho certeza de qual método é o melhor para usar e por quê. Alguém pode comparar e contrastar esses métodos? Obrigado.
modeling
generalized-linear-model
least-squares
nonlinear-regression
curve-fitting
em que força
fonte
fonte
Respostas:
A diferença é basicamente a diferença na distribuição assumida do componente aleatório e como o componente aleatório interage com o relacionamento médio subjacente.
O uso de mínimos quadrados não lineares pressupõe efetivamente que o ruído seja aditivo, com variação constante (e mínimos quadrados é a probabilidade máxima de erros normais).
Os outros dois assumem que o ruído é multiplicativo e que a variação é proporcional ao quadrado da média. Obter logs e ajustar uma linha de mínimos quadrados é a probabilidade máxima para o lognormal, enquanto o GLM que você ajustou é a probabilidade máxima (pelo menos para sua média) para o Gamma (sem surpresa). Esses dois serão bastante semelhantes, mas o Gamma colocará menos peso em valores muito baixos, enquanto o lognormal colocará relativamente menos peso nos valores mais altos.
(Observe que, para comparar corretamente as estimativas de parâmetro para essas duas, é necessário lidar com a diferença entre a expectativa na escala de log e a expectativa na escala original. A média de uma variável transformada não é a média transformada em geral.)
fonte