Solução para o exercício 2.2a.16 de "Estatísticas robustas: a abordagem baseada em funções de influência"

9

Na página 180 de Estatísticas robustas: A abordagem baseada nas funções de influência encontra-se a seguinte pergunta:

  • 16: Mostre que para estimadores invariantes à localização sempre . Encontre o limite superior correspondente no ponto de ruptura da amostra finita , ambos no caso em que é ímpar ou é par. ε * n nnε12εnnn

A segunda parte (após o período) é realmente trivial (dada a primeira), mas não consigo encontrar uma maneira de provar a primeira parte (sentença) da pergunta.

Na seção do livro referente a esta questão, encontra-se (p98):

Definição 2: O ponto de ruptura da amostra finita de um estimador na amostra é dado por:εnTn(xl,,xn)

εn(Tn;xi,,xn):=1nmax{m:maxi1,,imsupy1,,ym|Tn(z1,,zn)|<}

onde a amostra (z1,,zn) é obtida substituindo m pontos de dados xi1,,xim pelos valores arbitrários y1,,ym.

A definição formal de é executada em quase uma página, mas pode ser vista como Embora não seja definido explicitamente, um pode-se adivinhar que a localização invariável significa que deve atender a ε

ε=limnεn
Tn
Tn(x1,,xn)=Tn(x1+c,,xn+c), for all cR

Eu (tento) responder à pergunta do whuber no comentário abaixo. O livro define o estimador várias páginas, começando em p82, tento reproduzir as partes principais (acho que ele responderá à pergunta do whuber):Tn

Suponha que tenhamos observações unidimensionais que são independentes e distribuídas de forma idêntica (iid). As observações pertencem a algum espaço de amostra , que é um subconjunto da linha real (geralmente simplesmente é igual a , portanto as observações podem ter qualquer valor ) Um modelo paramétrico consiste em uma família de distribuições de probabilidade , no espaço de amostra, onde o parâmetro desconhecido pertence a algum espaço de parâmetro(X1,,Xn)HRHRFθθΘ

...

Identificamos a amostra com sua distribuição empírica , ignorando a sequência das observações (como quase sempre é feito). Formalmente, , é dada por onde , é o ponto de massa uma em . Como estimadores de , consideramos as estatísticas com valor real . Em um sentido mais amplo, um estimador pode ser visto como uma sequência de estatísticas , uma para cada tamanho de amostra possível . Idealmente, as observações são feitas de acordo com um membro do modelo paramétrico (X1,,Xn)GnGn(1/n)i=1nΔxiΔXXθTn=Tn(X1,,Xn)=Tn(Gn){Tn,n1}n{Fθ;θΘ} , mas a classe de todas as distribuições de probabilidade possíveis em é muito maior.F(H)H

Consideramos estimadores que são funcionais [ie, para todos os e ] ou que podem ser substituídos assintoticamente por funcionais. Isso significa que assumimos que existe um [onde o domínio de é o conjunto de todas as distribuições para o qual é definido], de modo que em probabilidade quando as observações são iid de acordo com a verdadeira distribuição in . Dizemos queTn(Gn)=T(Gn)nGnT:domain(T)RTF(H)T

Tn(X1,,Xn)nT(G)
Gdomain(T)T(G)é o valor assintótico de em .{Tn;n1}G

...

Neste capítulo, sempre assumimos que os funcionais em estudo são consistentes com Fisher (Kallianpur e Rao, 1955): que significa que em o modelo em que o estimador mede assintoticamente a quantidade certa. A noção de consistência de Fisher é mais adequada e elegante para os funcionais do que a consistência usual ou imparcialidade assintótica.

T(Fθ)=θ for all θΘ
{Tn;n1}

user603
fonte
11
Como exatamente este livro define "estimador"? Parece-me que qualquer estimador limitado deve ter um ponto de ruptura de ; portanto, certamente está colocando algum tipo de restrição especial em ; e sempre existem estimadores invariantes por localização limitados (eles incluem as constantes). Tn1Tn
whuber
11
Obrigado pelo material expandido. Ainda parece que há muitos contra-exemplos. Um simples é o estimador constante para a família de um parâmetro de distribuições normais de variância . Este é um estimador invariável da variação. Seu ponto de decomposição é . É consistente com Fisher (trivialmente), mas preciso interpretar a definição com cuidado: " " não pode se referir necessariamente a todos os parâmetros; portanto, nenhum estimador invariável em localização poderia ser consistente! Tn(X1,,Xn)=111θ
whuber
@ whuber: Obrigado, eu entendo o seu contra-exemplo. Acho que vou entrar em contato com o autor e pedir mais informações ...
user603

Respostas:

4

Livros estatísticos mais antigos usavam "invariáveis" de uma maneira ligeiramente diferente do que se poderia esperar; a terminologia ambígua persiste. Um equivalente mais moderno é "equivariante" (consulte as referências no final deste post). No presente contexto, significa

Tn(X1+c,X2+c,,Xn+c)=Tn(X1,X2,,Xn)+c

para todos os reais .c

Para resolver a questão, suponha que tenha a propriedade de, para suficientemente grande , todo real e todo ,Tnncmεn

|Tn(X+Y)Tn(X)|=o(|c|)

sempre que difere de por no máximo em no máximo coordenadas.YXcm

(Essa é uma condição mais fraca do que a assumida na definição de limite de quebra. De fato, tudo o que realmente precisamos assumir é que, quando é suficientemente grande, a expressão " " tem algum valor garantido menor que em tamanho.)no(|c|)|c|/2

A prova é por contradição. Suponha, portanto, que esse também seja equivalente e suponha . Então, para , suficientemente grande , é um número inteiro para o qual e . Para quaisquer números reais definaTnε>1/2nm(n)=εnm(n)/nε(nm(n))/nεa,b

tn(a,b)=Tn(a,a,,a, b,b,,b)

onde existem 's e ' s. Ao alterar ou menos das coordenadas, concluímos ambosm(n) anm(n) bm(n)

|t(a,b)t(0,b)|=o(|a|)

e

|t(a,b)t(a,0)|=o(|b|).

Para a desigualdade do triângulo afirmac>0

c=|tn(c,c)tn(0,0)||tn(c,c)tn(c,0)|+|tn(c,0)tn(0,0)|=o(c)+o(c)<c/2+c/2=c

A desigualdade estrita na penúltima linha é assegurada para suficientemente grande . A contradição que implica, , provanc<cε1/2.


Referências

EL Lehmann, Teoria da estimativa pontual . John Wiley 1983.

No texto (capítulo 3, seção 1) e uma nota de rodapé que acompanha Lehmann escreve

Um estimador que satisfaça para todos os será chamado equivariável ...δ(X1+a,,Xn+a)=δ(X1,,Xn)+aa

Alguns autores chamam esses estimadores de "invariantes". Como isso sugere que o estimador permanece inalterado sob , parece preferível reservar esse termo para funções que satisfaçam para todo .Xi=Xi+au(x+a)=u(x)x,a

whuber
fonte
11
sim, entrei em contato com o autor principal do livro ontem com a mesma pergunta sobre a definição real de invariância usada (procurei no índice e não consegui encontrá-lo explícito no livro). Votei positivamente porque acho que sua resposta é a correta, mas darei ao autor alguns dias para ter certeza antes de aceitá-la.
user603
11
Não recebi uma resposta do autor, mas os argumentos apresentados acima (na resposta e no comentário) me convenceram de que essa deve ser realmente a interpretação correta do problema.
usar o seguinte comando