Estimativa robusta da curtose?

11

Eu estou usando o estimador usual para , mas eu noto que mesmo pequenas outliers 'em minha distribuição empírica, isto é, pequenos picos muito longe do centro, afetá-lo tremendamente. Existe um estimador de curtose mais robusto?

K^=μ^4σ^4
yoki
fonte

Respostas:

8

Existem vários. Você encontrará uma comparação exaustiva neste link com uma versão sem edição do artigo (referência adequada na parte inferior desta resposta).

Devido às restrições do problema, a decomposição do mais robusto desses algoritmos (o L / RMC) é de no máximo 12,5%. Uma vantagem para o L / RMC é que ele é baseado em quantis e permanece interpretável mesmo quando a distribuição subjacente não tem momentos. Outra vantagem é que ele não assume simetria da distribuição da parte não contaminada dos dados para medir o peso da cauda: na verdade, o algoritmo retorna dois números: o RMC para o peso da cauda direita e o LMC para o peso da cauda esquerda.

[0,1]por construção: nenhuma quantidade de contaminação pode, por exemplo, fazer com que o algoritmo retorne -1!). Na prática, verifica-se que se pode substituir cerca de 5% da amostra por valores atípicos muito patológicos, sem fazer com que as estimativas mais afetadas (sempre existam duas) se afastem demais do valor que possuía na amostra não contaminada.

O L / RMC também é amplamente implementado. Por exemplo, você pode encontrar uma implementação R aqui . Conforme explicado no artigo vinculado acima, para calcular o L / RMC, é necessário calcular o MC (o estimador implementado no link) separadamente na metade esquerda e direita de seus dados. Aqui, metade esquerda (esquerda) são as subamostras formadas da observação (menores) maiores que a mediana da sua amostra original.

  • Brys, Hubert, Struyf. (2006). Medidas robustas do peso da cauda.
user603
fonte
2
Não são essas medidas alternativas de peso da cauda, ​​em vez de estimadores robustos de curtose, por exemplo? Pode ser o que ele realmente quer. mas não é exatamente o que ele pediu. Algum / todos esses estimadores convergem em curtose para amostras grandes?
andrewH
Resumo do artigo: Em dados não contaminados que satisfazem as condições da ordenação convexa de Van Zwet (sob a qual a medida da curtose é significativa), eles convergem para uma função monótona da curtose.
user603
1
A curtose de Pearson mede os valores discrepantes (observações extremas raras), simples e simples. Então, o que você está procurando? Uma medida de "pico"? Primeiro, não é o que mede a curtose de Pearson. Segundo, se você deseja uma medida de "pico", primeiro precisa definir o que isso significa. Se você pode defini-lo, pode estimar. Uma possibilidade é a segunda derivada do pdf dos dados padronizados, avaliados no pico. (De nada). Estou certo de que há outros.
quer
1
Na verdade, dou três teoremas matemáticos que relacionam a curtose às caudas da distribuição, para que não possam ser falsificados: (i) Para todas as distribuições com quarto momento finito, a curtose está entre E (Z ^ 4 * I (| Z |> 1 )) e E (Z ^ 4 * I (| Z |> 1)) +1. (ii) Na subclasse cuja densidade de Z ^ 2 é contínua e diminui em (0,1), o "+1" pode ser substituído por "+,5". (iii) Para qualquer sequência de distribuições com curtose -> infinito, E (Z ^ 4 * I (| Z |> b)) / curtose -> 1, para qualquer real b. Está tudo aqui: ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Peter Westfall