Estou estimando o modelo onde e são parâmetros , é um vetor de parâmetros length, é uma matriz de dados , a variável dependente é binária e é um modelo probit, portanto, a função de distribuição cumulativa da normal normal distribuição. Para derivar a expectativa, assumiu-se que os erros são normais e com média zero.
A fonte do modelo está aqui (veja as equações 6 e 7) e, pelo trabalho, posso estimar o modelo por meio de mínimos quadrados não lineares ou máxima verossimilhança. Tentei ambas as abordagens em R, usando a nls()
função para mínimos quadrados não lineares e a nlm()
função para máxima probabilidade. A experiência sugere que os resultados são muito semelhantes para minha aplicação, mas nls()
são mais rápidos. Existe uma razão para favorecer uma abordagem sobre a outra? Como devo pensar em escolher um método, por exemplo, suposições semelhantes subjacentes às duas abordagens?
Todas as sugestões para refletir sobre as diferenças entre essas duas abordagens ou sugestões de literatura relevante a serem consultadas serão muito apreciadas.
fonte
Respostas:
Se essa é sua suposição, o MLE e o NLS devem ser matematicamente idênticos e as diferenças provavelmente serão explicadas pela escolha / configuração do otimizador.
Se uma distribuição normal para uma resposta binária é uma boa ideia é outra questão. Uma alternativa seria um gerenciamento logístico com seu preditor não linear, estimado com MLE.
Se você usa o MLE, considere usar https://cran.r-project.org/web/packages/bbmle/index.html em vez de nlm (), mais opções para ICs e assim por diante.
fonte