Premissa: essa pode ser uma pergunta estúpida. Conheço apenas as declarações sobre as propriedades assintóticas do MLE, mas nunca estudei as provas. Se sim, talvez eu não esteja fazendo essas perguntas, ou talvez eu perceba que essas perguntas não fazem sentido ... então, por favor, vá devagar comigo :)
Eu sempre vi declarações que dizem que o estimador MLE dos parâmetros de um modelo é assintoticamente normal e eficiente. A declaração é geralmente escrita como
como
onde é o número de amostras, é informações de Fisher e é o valor verdadeiro do parâmetro (vetor) . Agora, como há referência a um modelo verdadeiro, isso significa que o resultado não será válido se o modelo não for verdadeiro?
Exemplo: suponha que eu modele a potência de uma turbina eólica em função da velocidade do vento mais ruído gaussiano aditivoV
Sei que o modelo está errado, por pelo menos duas razões: 1) é realmente proporcional à terceira potência de e 2) o erro não é aditivo, porque negligenciei outros preditores que não são correlacionados com a velocidade do vento (também sei esse deve ser 0 porque, na velocidade do vento 0, nenhuma energia é gerada, mas isso não é relevante aqui). Agora, suponha que eu tenha um banco de dados infinito de dados de potência e velocidade do vento da minha turbina eólica. Posso desenhar quantas amostras eu quiser, de qualquer tamanho. Suponha que eu colete 1000 amostras, cada uma com tamanho 100, e calcule , a estimativa do MLE deV p 0 β 100 β = ( β 0 , p 1 , β 2 ) β 100 N = 500 , 1000 , 1500 , ... N → ∞ β N(que, no meu modelo, seria apenas a estimativa do OLS). Assim, tenho 1000 amostras da distribuição de . Posso repetir o exercício com . Como , a distribuição de tende a ser assintoticamente normal, com a média e variância declaradas? Ou o fato de o modelo estar incorreto invalida esse resultado?
A razão pela qual estou perguntando é que raramente (se é que alguma vez) modelo é "verdadeiro" em aplicativos. Se as propriedades assintóticas do MLE forem perdidas quando o modelo não for verdadeiro, poderá fazer sentido usar diferentes princípios de estimativa, os quais, embora menos poderosos em um ambiente em que o modelo esteja correto, possam ter um desempenho melhor que o MLE em outros casos.
EDIT : observou-se nos comentários que a noção de modelo verdadeiro pode ser problemática. Eu tinha a seguinte definição em mente: dada uma família de modelos indicada pelo vetor de parâmetro , para cada modelo da família, você sempre pode escrever θ
simplesmente definindo como . No entanto, em geral, o erro não será ortogonal a , terá média 0 e não terá necessariamente a distribuição assumida na derivação do modelo. Se existe um valor tal que tem essas duas propriedades, bem como a distribuição assumida, eu diria que o modelo é verdadeiro. Eu acho que isso está diretamente relacionado a dizer que , porque o termo de erro na decomposição
tem as duas propriedades mencionadas acima.
fonte
Respostas:
Não acredito que haja uma única resposta para essa pergunta.
Quando consideramos uma possível especificação errônea de distribuição ao aplicar a estimativa de máxima verossimilhança, obtemos o que é chamado estimador "Quase-Máxima Verossimilhança" (QMLE). Em certos casos, o QMLE é consistente e assintoticamente normal.
O que perde com certeza é a eficiência assintótica. Isso ocorre porque a variação assintótica de (esta é a quantidade que tem uma distribuição assintótica, não apenas θ ) é, em todos os casos,n−−√(θ^−θ) θ^
onde é a matriz hessiana da probabilidade logarítmica e S é o gradiente e o chapéu indica estimativas da amostra.H S
Agora, se tivermos a especificação correta , obtemos, primeiro, que
que é o inverso da informação de Fisher.
fonte