Hessian de probabilidade de perfil usado para estimativa de erro padrão

13

Esta questão é motivada por esta . Procurei duas fontes e foi isso que encontrei.

A. van der Vaart, Estatísticas Assintóticas:

Raramente é possível calcular explicitamente a probabilidade de um perfil, mas sua avaliação numérica é geralmente viável. Então a probabilidade do perfil pode servir para reduzir a dimensão da função de probabilidade. As funções de probabilidade de perfil são frequentemente usadas da mesma maneira que as funções de probabilidade (comuns) de modelos paramétricos. Além de tomar os seus pontos de máxima como estimadores q , a segunda derivada em θ é usada como uma estimativa de menos o inverso da matriz de covariância assintótica de e. Pesquisas recentes parecem validar essa prática.θ^θ^

J. Wooldridge, Análise Econométrica de Seção Transversal e Dados de Painel (o mesmo em ambas as edições):

Como um dispositivo para o estudo de propriedades assintóticas, a função objetivo concentrada é de valor limitado, porque geralmente depende de todo W ; nesse caso, a função objetivo não pode ser escrita como a soma de somas independentes distribuídas de forma idêntica. Uma configuração em que a equação (12.89) é uma soma das funções iid ocorre quando concentramos efeitos específicos de determinados modelos de dados de painel não lineares. Além disso, a função objetivo concentrada pode ser útil para estabelecer a equivalência de abordagens de estimativa aparentemente diferentes.g(W,β)W

Wooldridge discute o problema em um contexto mais amplo de estimadores M, por isso também se aplica aos estimadores de probabilidade máxima.

Portanto, temos duas respostas diferentes para a mesma pergunta. O diabo na minha opinião está nos detalhes. Para alguns modelos, podemos usar com segurança a probabilidade de perfil do hessian para alguns modelos não. Existem resultados gerais que dão condições quando podemos fazer isso (ou não)?

mpiktas
fonte
Essas passagens parecem não abordar a mesma questão: a primeira diz respeito ao cálculo numérico de um determinado conjunto de dados, enquanto a segunda diz respeito a "estudar propriedades assintóticas". O uso do hessiano é tipicamente uma consideração puramente matemática com respostas tipicamente diretas: veja nossa discussão relacionada .
whuber
van der Vaart diz que Hessian é usado para o cálculo da matriz de covariância assintótica . Como Wooldridge fala que a função objetivo concentrada não pode ser usada para estudar propriedades assintóticas, isso implica que seu hessian (numérico) não pode ser usado para estimar erros padrão. Não esqueci nossa discussão, então tomo essa passagem com o grão de sal. No entanto, nem van der Vaart nem Wooldridge deram nenhuma referência. Antes de fazer uma extensa pesquisa, eu só queria verificar se isso é algo bem conhecido.
mpiktas
Ponto excelente: de alguma forma, negligenciei o "assintótico" na citação de van der Vaart. Contudo, ainda não pode haver contradição: Wooldridge apenas diz que a justificativa simples óbvia (iid summands) não está disponível para demonstrar que a abordagem de van der Vaart funciona; Wooldridge não diz que não funciona ;-).
whuber
@ Whuber, sim, mas ele também não diz que funciona :) Estou ciente de que pode não haver contradição, só quero saber se existem alguns resultados definitivos.
precisa saber é o seguinte
2
Veja No perfil de probabilidade (SA Murphy e AW van der Vaart), jstor.org/pss/2669386
whuber

Respostas:

1

Para alguns modelos, podemos usar com segurança a probabilidade de perfil do hessian para alguns modelos não

Infelizmente, isso é verdade por enquanto e é improvável que mude.

A discussão mais clara que tenho conhecimento é: As regras da inferência condicional: existe uma definição universal de não-formação? B Jørgensen - Statistical Methods & Applications, 1994.

E, para algumas das questões específicas de corrigir falhas de perfil, ver Staodford , JE (1996). Um ajuste robusto da probabilidade do perfil, Annals of Statistics, 24, 336-52.

phaneron
fonte
1

Uma resposta rápida: Isso é discutido no capítulo três de OE Barndorff-Nielsen e DR Cox: Inferência e assintóticos, Chapman & Hall, página 90, equação 3.31, que eles atribuem a Patefield. Eles concluem que, para um parâmetro escalar, isso é válido (eles não analisam outros casos).

kjetil b halvorsen
fonte