Para que distribuição é uma média aparada, o estimador de probabilidade máxima?

8

A média da amostra é o estimador de probabilidade máxima de para uma distribuição normal . A mediana da amostra é o estimador de probabilidade máxima de para uma distribuição de Laplace (também chamada de distribuição exponencial dupla).μNormal(μ,σ)m Laplace(m,s)

Existe uma distribuição com um parâmetro de localização para o qual a média aparada da amostra é o estimador de probabilidade máxima?

Rasmus Bååth
fonte

Respostas:

9

As distribuições, se houver, são obtidas como integrais das equações de estimativa. Vamos assumir por simplicidade que o parâmetro de escala é conhecido e os parâmetros de corte, se houver, são fixos.

  1. Para a média da amostra, a equação de estimativa éImaginando que essa é a derivada da probabilidade logarítmica, com muito abuso de notação e perda de rigor, temos onde a parâmetro (constante de integração) tem de ser negativo para garantir que ele se integra para algo significativo.
    E(xμ)=0.
    dlnl(μ;x)dμ=xμ,lnl(μ;x)=a(xμ)2,l(μ;x)exp[a(xμ)2],
    a
  2. Para a mediana da amostra, a equação de estimativa éIntegre isso para obter onde novamente teríamos que escolher para ser negativo para fazer sentido.
    Esign(xμ)=0.
    l(μ;x)exp[a|xμ|],
    a
  3. Para a média aparada, a equação de estimativa éVamos ver o que ele integra:Parece um normal censurado no centro, mas veja as caudas: elas são impróprias se . Portanto, para obter uma distribuição adequada, precisamos definir . Mas então temos uma inconsistência lógica: essa distribuição teria que dar um zero de pdf para alguns dados reais nas caudas aparadas. Isso é auto-contraditório e mostra alguns efeitos colaterais indesejáveis ​​do corte.
    Eρ(x,μ,c)=0,ρ(x,μ,c)={xμ,|xμ|c,0,|xμ|>c.
    l(μ;x,c)={exp[a(xμ)2],|xμ|c,b,|xμ|>c.
    b>0b=0

Às vezes, é benéfico estabelecer a "probabilidade" de um método para mostrar sua normalidade assintótica e eficiência para uma classe restrita de distribuições. Em geral, a normalidade assintótica da média aparada pode seguir a partir da teoria dos valores- .M

StasK
fonte
1
Essa é realmente a equação de estimativa de uma média aparada? Em sua equação parece ser uma constante que "devoluções" de dados que está longe o tempo médio na versão normal de uma média aparada a definir qual a proporção dos pontos de dados devem ser descartados a partir das caudas dos dados. Não são essas duas coisas diferentes ou estou faltando alguma coisa? cc
Rasmus Bååth
Sim, é realmente um pouco diferente - eu disse que estou tratando a constante de corte como fixa. Torná-lo dependente de dados complicará as coisas, mas acredito que levaria à conclusão similar de que alguns dos pontos de dados são "impossíveis" sob a distribuição implícita na "probabilidade".
StasK
4

Casos especiais, como a mediana à parte, não acho que os meios aparados sejam geralmente ML; se fossem, já seriam uma forma de estimador-M. No entanto, se você usar uma distribuição que é normal no meio com, digamos, caudas exponenciais - a distribuição correspondente a um estimador Huber M -, para um nível específico de corte, espera-se que a média aparada seja altamente eficiente.

Glen_b -Reinstate Monica
fonte