Os estimadores eficientes imparciais são estocamente dominantes em relação a outros estimadores imparciais (medianos)?

9

Descrição geral

Um estimador eficiente (que tem variação de amostra igual ao limite Cramér – Rao) maximiza a probabilidade de estar próximo ao parâmetro verdadeiro ?θ

Digamos que comparemos a diferença ou diferença absoluta entre a estimativa e o parâmetro verdadeiro

Δ^=θ^-θ

A distribuição de para um estimador eficiente é estocástica dominante sobre a distribuição de para qualquer outro estimador imparcial?Δ^Δ~


Motivação

Estou pensando sobre isso por causa da pergunta Estimador que é ideal em todas as funções sensíveis de perda (avaliação), onde podemos dizer que o melhor estimador imparcial em relação a uma função de perda convexa também é o melhor estimador imparcial em relação a outra função de perda (De Iosif Pinelis, 2015, Caracterização dos melhores estimadores imparciais: arXiv preprint arXiv: 1508.07636 ). O domínio estocástico por estar próximo ao parâmetro verdadeiro parece ser semelhante a mim (é uma condição suficiente e uma afirmação mais forte).


Expressões mais precisas

A declaração da pergunta acima é ampla, por exemplo, que tipo de imparcialidade é considerada e temos a mesma métrica de distância para diferenças negativas e positivas?

Vamos considerar os dois casos a seguir para tornar a questão menos ampla:

Conjectura 1: Se é um estimador eficiente de média e mediana. Então, para qualquer estimador médio e sem vieses que e θ^θ~

E se x>0 0 então P[Δ^x]P[Δ~x]E se x<0 0 então P[Δ^x]P[Δ~x]
Δ = θ - θ ~ Δ = ~ θ - θΔ^=θ^-θΔ~=θ~-θ

Conjectura 2: Se é um estimador eficiente e isento de médias. Então, para qualquer estimador sem médios e θ^θ~x>0 0

P[|Δ^|x]P[|Δ~|x]

  • As conjecturas acima são verdadeiras?
  • Se as proposições são muito fortes, podemos adaptá-las para fazer funcionar?

O segundo está relacionado ao primeiro, mas elimina a restrição da imparcialidade da mediana (e, em seguida, precisamos juntar os dois lados ou a proposta seria falsa para qualquer estimador que tenha uma mediana diferente da estimada eficiente).


Exemplo, ilustração:

Considere a estimativa da média da distribuição de uma população (que se supõe distribuição normal) por (1) a mediana da amostra e (2) a média da amostra.μ

No caso de uma amostra de tamanho 5, e quando a verdadeira distribuição da população é isso se parece comN(0 0,1)

exemplo cdf

Na imagem, vemos que o CDF dobrado da média da amostra (que é um estimador eficiente para ) está abaixo do CDF dobrado da mediana da amostra. A questão é se o CDF dobrado da média da amostra também está abaixo do CDF dobrado de qualquer outro estimador imparcial.μ

Como alternativa, usando o CDF em vez de CDFs dobrados, podemos perguntar se o CDF de uma média maximiza a distância de 0,5 em cada ponto. Sabemos que

θ^:|Fmeuman(θ^)-0,5||FmedEuuman(θ^)-0,5|

também temos isso quando substituímos pela distribuição de qualquer outro estimador médio e isento de mediana?FmedEuuman(θ^)

Sextus Empiricus
fonte
2
Verifique a Pitman nearnesspalavra - chave, não que eu ache esse critério particularmente sensível.
Xian
1
Pela conjectura, pareceria mais razoável usar estimadores isentos de mediana do que estimadores isentos de média. (Existem estimadores não tendenciosos em algumas configurações e melhor imparcial em ainda menos configurações.)
Xi'an
1
O 'critério de proximidade de Pitman' é realmente interessante. Com base nas informações da Wikipedia , vejo como "a probabilidade de a diferença absoluta estar mais próxima". É um pouco diferente. Esse critério de proximidade de Pitman pode criar casos interessantes em que algum estimador tem, em média, uma diferença absoluta menor, mas não vence de acordo com esse critério de proximidade.
Sextus Empiricus
1
θ^θ~θθ~θθ
1
@ Xi'an Adicionei um exemplo visual e agora recebo seu comentário sobre o viés mediano versus o viés mediano. Eu ajustei a pergunta (embora ela esteja divergindo da minha idéia original relacionada à questão vinculada, que precisa de alguns ajustes mais complexos agora).
Sextus Empiricus

Respostas:

5

(X1,,XN)C(μ,1)μ

  1. μ^1=mediana(X1,,XN)=X(N/2)
  2. μ^2=significar(X(N/4),,X(3N/4))=2N(X(N/4)++X(3N/4))
  3. μ^3=μMLE
  4. μ^4=μ^1+2Nμ(μ^1)

μ^3μ^4μ^1μ^2insira a descrição da imagem aqui

Uma representação das diferenças para o cdf empírico do MLE torna mais claro:

insira a descrição da imagem aqui

Aqui está o código R correspondente:

T=1e4
N=11
mlechy=function(x){
  return(optimize(function(theta) -sum(dcauchy(x, 
    location=theta, log=TRUE)),  c(-100,100))$minimum)
}
est=matrix(0,T,4)
for (t in 1:T){
cauc=sort(rcauchy(N))
est[t,1]=median(cauc)
est[t,2]=mean(cauc[4:8])
est[t,3]=mlechy(cauc)
est[t,4]=est[t,1]+(4/N)*sum((cauc-est[t,1])/(1+(cauc-est[t,1])^2))
}

plot(ecdf(est[,1]),col="steelblue",cex=.4,xlim=c(-1,1),main="",ylab="F(x)")
plot(ecdf(est[,2]),add=TRUE,col="sienna",cex=.4)
plot(ecdf(est[,3]),add=TRUE,col="gold",cex=.4)
plot(ecdf(est[,4]),add=TRUE,col="tomato",cex=.4)
Xi'an
fonte
1
A curva de ouro (a diferença do MLE empírico com ele mesmo) não deveria ser zero no gráfico de diferenças.
Sextus Empiricus
Meu pior, mudei os códigos de cores: tomate é a diferença com o quarto, ouro é a diferença com Pitman, sienna é a diferença com a média aparada e azul é a diferença com a mediana.
Xian