Esta questão é inspirada na longa discussão nos comentários aqui: Como a regressão linear usa a distribuição normal?
No modelo de regressão linear usual, por simplicidade, aqui escrito com apenas um preditor:
onde são constantes conhecidas e são termos de erro independentes com média zero. Se, além disso, assumirmos distribuições normais para os erros, os estimadores usuais de mínimos quadrados e os estimadores de probabilidade máxima de serão idênticos.ϵ i β 0 , β 1
Portanto, minha pergunta fácil: existe alguma outra distribuição para os termos de erro, de modo que a mle seja idêntica ao estimador ordinário de mínimos quadrados? A implicação é fácil de mostrar, a outra não.
regression
normal-distribution
mathematical-statistics
maximum-likelihood
least-squares
kjetil b halvorsen
fonte
fonte
Respostas:
Na estimativa da máxima verossimilhança, calculamos
a última relação levando em consideração a estrutura de linearidade da equação de regressão.
Em comparação, o estimador OLS satisfaz
Para obter expressões algébricas idênticas para os coeficientes de declive, precisamos ter uma densidade para o termo de erro tal que
Estas são equações diferenciais da forma que têm soluçõesy′=±xy
Qualquer função que possua esse kernel e se integre à unidade em um domínio apropriado fará com que o MLE e o OLS dos coeficientes de inclinação sejam idênticos. Ou seja, estamos procurando
Certamente. Mas mais uma coisa que devemos considerar é o seguinte: se alguém usar o sinal de mais no expoente e um suporte simétrico em torno de zero, por exemplo, obterá uma densidade que tenha um mínimo exclusivo no meio e dois máximos locais em os limites do apoio.
fonte
fonte
Eu não sabia sobre essa pergunta até @ Xi'an apenas atualizar com uma resposta. Existe uma solução mais genérica. As distribuições exponenciais da família com alguns parâmetros fixaram o rendimento para as divergências de Bregman. Para essas distribuições, a média é o minimizador. O minimizador de OLS também é a média. Portanto, para todas essas distribuições, elas devem coincidir quando o funcional linear estiver vinculado ao parâmetro da média.
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.75.6958&rep=rep1&type=pdf
fonte