Eu estou usando o estimador usual para , mas eu noto que mesmo pequenas outliers 'em minha distribuição empírica, isto é, pequenos picos muito longe do centro, afetá-lo tremendamente. Existe um estimador de curtose mais robusto?
Existem vários. Você encontrará uma comparação exaustiva neste link com uma versão sem edição do artigo (referência adequada na parte inferior desta resposta).
Devido às restrições do problema, a decomposição do mais robusto desses algoritmos (o L / RMC) é de no máximo 12,5%. Uma vantagem para o L / RMC é que ele é baseado em quantis e permanece interpretável mesmo quando a distribuição subjacente não tem momentos. Outra vantagem é que ele não assume simetria da distribuição da parte não contaminada dos dados para medir o peso da cauda: na verdade, o algoritmo retorna dois números: o RMC para o peso da cauda direita e o LMC para o peso da cauda esquerda.
por construção: nenhuma quantidade de contaminação pode, por exemplo, fazer com que o algoritmo retorne -1!). Na prática, verifica-se que se pode substituir cerca de 5% da amostra por valores atípicos muito patológicos, sem fazer com que as estimativas mais afetadas (sempre existam duas) se afastem demais do valor que possuía na amostra não contaminada.
O L / RMC também é amplamente implementado. Por exemplo, você pode encontrar uma implementação R aqui . Conforme explicado no artigo vinculado acima, para calcular o L / RMC, é necessário calcular o MC (o estimador implementado no link) separadamente na metade esquerda e direita de seus dados. Aqui, metade esquerda (esquerda) são as subamostras formadas da observação (menores) maiores que a mediana da sua amostra original.