Por que a curtose positiva alta é problemática para testes de hipóteses?

13

Ouvi (desculpe, não posso fornecer um link para um texto, algo que me foi dito) que uma curtose positiva alta de resíduos pode ser problemática para testes de hipóteses precisos e intervalos de confiança (e, portanto, problemas com inferência estatística). Isso é verdade e, se sim, por quê? Uma curtose positiva alta dos resíduos não indicaria que a maioria dos resíduos está próxima da média residual de 0 e, portanto, menos resíduos grandes estão presentes? (Se você tiver uma resposta, tente dar uma resposta com pouca matemática aprofundada, pois eu não sou altamente inclinado matematicamente).

DDK
fonte
4
Suponho que você esteja se concentrando em modelos com condições ideais de termos de erro normais (gaussianos). (Em muitos outros contextos, pode-se esperar alta curtose de resíduos.) A curtose alta provavelmente implica uma distribuição com cauda mais gorda do que o normal, portanto, alguns resíduos muito altos (+ ou -). Mesmo se houver muitos próximos de zero, essas são apenas as boas notícias e são as possíveis más notícias que precisam de atenção. Mas, por sua vez, isso pode significar qualquer número de coisas. Um gráfico residual versus um ajustado é geralmente mais informativo.
Nick Cox
Na verdade, eu estava focando em modelos com premissas de normalidade.
DDK

Respostas:

15

soube que uma curtose positiva alta de resíduos pode ser problemática para testes de hipóteses precisos e intervalos de confiança (e, portanto, problemas com inferência estatística). Isso é verdade e, se sim, por quê?

Para alguns tipos de teste de hipótese, é verdade.

Uma curtose positiva alta dos resíduos não indicaria que a maioria dos resíduos está próxima da média residual de 0 e, portanto, menos resíduos grandes estão presentes?

Não.

Parece que você está confundindo o conceito de variação com o da curtose. Se a variação fosse menor, haveria uma tendência a mais resíduos pequenos e menos resíduos grandes. Imagine que mantemos o desvio padrão constante enquanto alteramos a curtose (então estamos definitivamente falando sobre alterações na curtose e não na variação).

Compare diferentes variações (mas com a mesma curtose):

insira a descrição da imagem aqui

com curtose diferente, mas com a mesma variância:

insira a descrição da imagem aqui

(imagens desta postagem )

Uma curtose alta está, em muitos casos, associada a desvios mais pequenos da média - mais pequenos resíduos do que você encontraria com uma distribuição normal. Mas, para manter o desvio padrão no mesmo valor, também devemos ter mais resíduos grandes (porque ter mais resíduos pequenos tornaria a distância típica da média menor). Para obter mais dos grandes e pequenos resíduos, você terá menos resíduos "de tamanho típico" - aqueles com cerca de um desvio padrão da média.

depende de como você define "pequenez"; você não pode simplesmente adicionar lotes de grandes resíduos e variância constante espera, você precisa de algo para compensar isso - mas por algumdado medida de "pequena" você pode encontrar maneiras de aumentar a curtose sem aumentar essa medida particular. (Por exemplo, curtose mais alta não implica automaticamente um pico mais alto como tal)

Uma curtose mais alta tende a resultar em resíduos maiores, mesmo quando você mantém a variação constante.

[Além disso, em alguns casos, a concentração de pequenos resíduos pode realmente levar a mais problemas do que a fração adicional dos maiores resíduos - dependendo do que você está vendo.]

Enfim, vejamos um exemplo. Considere um teste t de uma amostra e um tamanho de amostra 10.

Se rejeitarmos a hipótese nula quando o valor absoluto da estatística t for maior que 2.262, quando as observações forem independentes, distribuídas de forma idêntica a partir de uma distribuição normal, e a média hipotética for a verdadeira média populacional, rejeitaremos a nula hipótese 5% do tempo.

Considere uma distribuição específica com curtose substancialmente mais alta que a normal: 75% da nossa população têm seus valores extraídos de uma distribuição normal e os 25% restantes têm seus valores extraídos de uma distribuição normal com desvio padrão 50 vezes maior.

Se calculei corretamente, isso corresponde a uma curtose de 12 (excesso de curtose de 9). A distribuição resultante é muito mais alta que a normal e tem caudas pesadas. A densidade é comparada com a densidade normal abaixo - você pode ver o pico mais alto, mas não consegue ver a cauda mais pesada na imagem esquerda, então também plotei o logaritmo das densidades, que se estende pela parte inferior da a imagem e comprime a parte superior, facilitando a visualização do pico e da cauda.

insira a descrição da imagem aqui

O nível de significância real para esta distribuição se você realizar um teste t de uma amostra de "5%" com n=10 está abaixo de 0,9%. Isso é bastante dramático e reduz substancialmente a curva de potência.

(Você também verá um efeito substantivo na cobertura dos intervalos de confiança.)

Observe que uma distribuição diferente com a mesma curtose que terá um impacto diferente no nível de significância.


Então, por que a taxa de rejeição diminui? É porque a cauda mais pesada leva a alguns outliers grandes, que têm um impacto um pouco maior no desvio padrão do que na média; isso afeta a estatística t porque leva a mais valores t entre -1 e 1, no processo, reduzindo a proporção de valores na região crítica.

Se você pegar uma amostra que parece bastante consistente com a origem de uma distribuição normal cuja média é suficientemente acima da média hipotética, ela é significativa e, em seguida, você leva a observação mais acima da média e a afasta ainda mais (ou seja, tornar a média ainda maior do que sob H0 0

Deixe-me te mostrar. Aqui está uma amostra do tamanho 10:

 1.13 1.68 2.02 2.30 2.56 2.80 3.06 3.34 3.68 4.23

H0:μ=2

Agora faça esse valor maior 50:

      1.13 1.68 2.02 2.30 2.56 2.80 3.06 3.34 3.68 50

Claramente, aumentamos a média, por isso deve indicar uma diferença ainda mais do que antes, certo? Bem, não, não faz. A estatística t diminui . Agora é 1.106, e o valor p é bastante grande (perto de 30%). O que aconteceu? Bem, aumentamos a média (para 7,257), mas o desvio padrão subiu mais de 15.

Os desvios padrão são um pouco mais sensíveis aos valores discrepantes do que os meios - quando você coloca um valor discrepante, tende a empurrar a estatística t de uma amostra para 1 ou -1.

Se houver uma chance de vários discrepantes, o mesmo acontece, apenas eles podem estar em lados opostos (nesse caso, o desvio padrão é ainda mais inflado, enquanto o impacto na média é reduzido em comparação com um discrepante), então a estatística t tende a se aproximar de 0.

Coisas semelhantes acontecem com vários outros testes comuns que assumem normalidade - a curtose mais alta tende a ser associada a caudas mais pesadas, o que significa mais discrepâncias, o que significa que os desvios padrão são inflados em relação às médias e, portanto, as diferenças que você deseja captar tendem a ficar "inundado" pelo impacto dos discrepantes no teste. Ou seja, baixa potência.

Glen_b -Reinstate Monica
fonte
1
Uau, muito obrigado pela resposta muito clara e elaborada. Seu tempo é muito apreciado!
DDK
Também é importante notar que, embora a distribuição de amostra grande da média da amostra não dependa da curtose (portanto, o nível de significância real dos testes de normalidade para médias converge para o nível nominal, normalmente 0,05, como n-> infinito, para todas as curtose finitas), o mesmo não é verdadeiro para testes de variâncias. A distribuição de amostra grande da variância estimada depende da curtose, portanto, o nível de significância real dos testes clássicos de suposição de normalidade para a variância não converge para o nível nominal como n -> infinito quando a curtose é diferente de zero.
Peter Westfall #
Além disso, a curtose mais alta não implica, matematicamente, que haja "mais pequenos desvios da média". A única coisa que lhe diz com certeza é que há mais na cauda.
Peter Westfall #
Você não pode obter desvios maiores e manter a variação constante, a menos que também faça desvios menores; se você não mantiver a variação constante, mais desvios se tornarão pequenos em relação à nova escala. Então, sim, quando se trata de olhar para a curtose, a matemática diz a você que mais grandes carregam menos.
Glen_b -Reinstala Monica
ZXκ=E(Z4)κ1=E(Z2)κZVar(Z)=1Xμ±kσkXXZ
3

A curtose mede valores extremos. Os valores extremos são problemáticos para as inferências padrão (por exemplo, testes t, intervalos t) que são baseadas na distribuição normal. Esse é o fim da história! E é realmente uma história bastante simples.

A razão pela qual essa história não é bem apreciada é porque persiste o mito antigo de que a curtose mede "o pico".

Aqui está uma explicação simples que mostra por que a curtose mede valores extremos e não "pico".

Considere o seguinte conjunto de dados.

0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1

Curtose é o valor esperado de (valores-z) ^ 4. Aqui estão os (valores z) ^ 4:

6,51, 0,30, 5,33, 0,45, 0,00, 0,30, 6,51, 0,00, 0,45, 0,30, 0,00, 6,51, 0,00, 0,00, 0,30, 0,00, 27,90, 0,00, 0,30, 0,45

A média é 2,78, e essa é uma estimativa da curtose. (Subtraia 3 se desejar excesso de curtose.)

Agora, substitua o último valor dos dados por 999 para que ele se torne um erro externo:

0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999

Agora, aqui estão os (valores z) ^ 4:

0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00,0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360,98

A média é 18,05, e essa é uma estimativa da curtose. (Subtraia 3 se desejar excesso de curtose.)

Claramente, apenas os discrepantes são importantes. Nada sobre o "pico" ou os dados próximos ao meio é importante.

Se você executar análises estatísticas padrão com o segundo conjunto de dados, deverá esperar problemas. A curtose grande alerta você para o problema.

Aqui está um artigo que elabora:

Westfall, PH (2014). Kurtosis as Peakedness, 1905 - 2014. RIP The American Statistician, 68, 191–195.

Peter Westfall
fonte
Por que não usar apenas testes não paramétricos? Para esses tipos de problemas, é provável que sejam superiores.
Carl
1
Concordado, essa é uma avenida possível, se você gosta de testar, que está rapidamente se tornando menos interessante em sua forma clássica. Mas essa não é realmente a minha preocupação. Estou mais interessado em modelagem probabilística em geral. Uma aplicação: Talvez você realmente esteja interessado na média, por exemplo, nos casos em que a variável dependente é o valor agregado, a média do processo é mais interessante que a mediana do processo. Então, o que os dados dizem sobre o processo significam quando os dados são propensos a outlier? É um problema difícil, mas importante e a curtose do momento é relevante para a resposta. Não testes sem comparação.
Peter Westfall #
Para a distribuição de Cauchy, a média aparada pode ser uma medida melhor da localização do que a mediana, e a média comum não seria uma medida da localização. O que usar como medida de localização depende da distribuição. Um exemplo para o qual a curtose não seria útil como indicador é a distribuição uniforme para a qual o valor extremo médio é uma melhor medida de localização do que a mediana e a média.
Carl
Não é o ponto. Se você estiver interessado em totais, por exemplo, dólares, a média comum é a medida da localização desejada.
Peter Westfall
Se você tiver uma variável distribuída Cauchy, poderá defender o total de dólares ganhos, mas a média não será uma medida de localização especialmente útil, o que significa que o "valor esperado" não possui uma expectativa razoável associada a ela.
Carl
-3

A curtose também indica caudas assimétricas. Em um teste de hipótese bicaudal, uma cauda será uma cauda longa e a outra será uma cauda curta. Uma das caudas pode ser> alfa, mas <beta. Uma cauda passaria o valor p, mas a outra não.

Basicamente, a inferência estatística assume um padrão normal. Quando não é um padrão normal, você pode se dar bem com uma inferência baseada em algumas mecânicas de inferência mais sofisticadas. Você pode ser capaz de nos deduzir Poisson, mas com uma distribuição que não é normal, não é possível usar inferência baseada em valores normais.

Inclinação e curtose são uma medida de não normalidade. Aprendemos a usar meios e usar distribuições normais antes de saber que precisamos testar a normalidade. Um normal requer 36 ou mais pontos de dados de cada dimensão. Você pode estimar em 20 pontos de dados, mas ainda terá inclinação e curtose. À medida que a distribuição se aproxima da normalidade, a inclinação e a distribuição desaparecem.

Uma das explicações definiu a curtose como pico. Outro não. Esta é uma luta instável neste momento. A curtose é o quarto momento, uma área. Estou no ponto alto da questão.

Outra idéia que existe é que, com uma inclinação, a mediana se inclina para o modo que forma um triângulo. Desfrutar.

David W. Locke
fonte
1
Não está claro que isso adicione algo útil e diferente a respostas já excelentes. Ele adiciona várias declarações intrigantes, por exemplo, "normal requer 36 ou mais pontos de dados" (então 35 não está bem? Qual é a base dessa alegação? "Distorção como pico" não acho que alguém esteja afirmando isso. " . padrão normal ": não é, em geral, curtose quarto momento, uma área: nenhuma; curtose como definido aqui é uma relação adimensional, com base na quarta e segundo momentos em torno da média.
Nick Cox
O quarto momento é uma integral, por isso é uma área. Como essa área é traduzida em pico ou curvatura, perdi-me.
David W. Locke
A explicação típica da curtose é o pico, mas isso está errado na minha opinião. Vou editar minha resposta original para alterar a assimetria, pois o pico é dizer que a curtose é ... Obrigado.
David W. Locke
As caudas não são simétricas. Eu nunca vi nada sobre inferência estatística que considere caudas assimétricas. O risco de curtose acontece porque as caudas se movem à medida que mais pontos de dados são coletados. Inclinação e curtose é sobre não ter dados suficientes para atingir um normal padrão.
22718 David David Locke
1
Não é assim: existe uma massa de teoria e aplicações para exponencial, gama, Weibull e muitas outras distribuições que não são normais.
Nick Cox