O tratamento clássico da inferência estatística se baseia na suposição de que uma estatística especificada corretamente é usada. Ou seja, a distribuição que gerou os dados observados faz parte do modelo estatístico : No entanto, na maioria das situações, não podemos assumir que isso seja realmente verdade. Eu me pergunto o que acontece com os procedimentos de inferência estatística se abandonarmos a suposição especificada corretamente.y M P ∗ (Y)∈ M ={ P θ (Y):θ∈Θ}
Eu encontrei algum trabalho de White 1982 sobre estimativas ML sob especificação incorreta. Argumenta-se que o estimador de máxima verossimilhança é um estimador consistente para a distribuição que minimiza a divergência KL de todas as distribuições dentro do modelo estatístico e a verdadeira distribuição \ mathbb {P} ^ * . P *
O que acontece com os estimadores de conjuntos de confiança? Permite recapitular estimadores de conjuntos de confiança. Seja um estimador de conjunto, onde é o espaço de amostra e a potência definida sobre o espaço de parâmetros . O que gostaríamos de saber é a probabilidade do evento de que os conjuntos produzidos por incluam a distribuição verdadeira , ou seja,
No entanto, é claro que não sabemos a verdadeira distribuição . A suposição especificada corretamente nos diz que . No entanto, ainda não sabemos qual é a distribuição do modelo. Mas,
Se abandonarmos a suposição especificada corretamente, não será necessariamente um limite inferior para , o termo em que realmente estamos interessados. De fato, se assumirmos que o modelo é mal especificado, o que é discutível no caso das situações mais realistas, é 0, porque a verdadeira distribuição não está contida no modelo estatístico .
De outra perspectiva, pode-se pensar em que se relaciona quando o modelo é especificado incorretamente. Esta é uma pergunta mais específica. Does ainda tem um significado, se o modelo for mal especificado. Se não, por que estamos nos incomodando com estatísticas paramétricas?
Eu acho que White 1982 contém alguns resultados sobre essas questões. Infelizmente, minha falta de formação matemática me impede de entender muito do que está escrito lá.
Respostas:
Seja os dados observados, que se presume serem a realização de uma sequência de variáveis aleatórias iid com a função de densidade de probabilidade comum definida com relação a uma medida finita sigma . A densidade é denominada densidade de processo de geração de dados (DGP).y1,…,yn Y1,…,Yn pe ν pe
No modelo de probabilidade do pesquisador é uma coleção de funções de densidade de probabilidade que são indexadas por um vetor de parâmetro . Suponha que cada densidade em seja definida em relação a uma medida sigma-finita comum (por exemplo, cada densidade pode ser uma função de massa de probabilidade com o mesmo espaço de amostra ).M≡{p(y;θ):θ∈Θ} θ M ν S
É importante manter a densidade que realmente gerou os dados conceitualmente distintos do modelo de probabilidade dos dados. Nos tratamentos estatísticos clássicos, uma separação cuidadosa desses conceitos é ignorada, não feita, ou assume-se desde o início que o modelo de probabilidade está especificado corretamente.pe
Um modelo especificado corretamente em relação a é definido como um modelo em que quase em toda parte. Quando está especificado em relação a isso corresponde ao caso em que o modelo de probabilidade não está especificado corretamente.M pe pe∈M ν M pe
Se o modelo de probabilidade for especificado corretamente, existe um no espaço de parâmetros modo que quase em toda parte. Esse vetor de parâmetro é chamado de "vetor de parâmetro verdadeiro". Se o modelo de probabilidade for mal especificado, o vetor de parâmetro verdadeiro não existe.θ∗ Θ pe(y)=p(y;θ∗) ν
Finalmente, alguns comentários sobre a especificação incorreta do modelo. É fácil encontrar exemplos em que um modelo mal especificado é extremamente útil e muito preditivo. Por exemplo, considere um modelo de regressão não linear (ou mesmo linear) com um termo de erro residual gaussiano cuja variação é extremamente pequena, mas o erro residual real no ambiente não é gaussiano.
Também é fácil encontrar exemplos em que um modelo especificado corretamente não é útil nem preditivo. Por exemplo, considere um modelo de passeio aleatório para prever os preços das ações que prevêem que o preço de fechamento de amanhã é uma soma ponderada do preço de fechamento de hoje e algum ruído gaussiano com uma variação extremamente grande.
fonte
fonte