Ouvi (desculpe, não posso fornecer um link para um texto, algo que me foi dito) que uma curtose positiva alta de resíduos pode ser problemática para testes de hipóteses precisos e intervalos de confiança (e, portanto, problemas com inferência estatística). Isso é verdade e, se sim, por quê? Uma curtose positiva alta dos resíduos não indicaria que a maioria dos resíduos está próxima da média residual de 0 e, portanto, menos resíduos grandes estão presentes? (Se você tiver uma resposta, tente dar uma resposta com pouca matemática aprofundada, pois eu não sou altamente inclinado matematicamente).
13
Respostas:
Para alguns tipos de teste de hipótese, é verdade.
Não.
Parece que você está confundindo o conceito de variação com o da curtose. Se a variação fosse menor, haveria uma tendência a mais resíduos pequenos e menos resíduos grandes. Imagine que mantemos o desvio padrão constante enquanto alteramos a curtose (então estamos definitivamente falando sobre alterações na curtose e não na variação).
Compare diferentes variações (mas com a mesma curtose):
com curtose diferente, mas com a mesma variância:
(imagens desta postagem )
Uma curtose alta está, em muitos casos, associada a desvios mais pequenos da média ‡ - mais pequenos resíduos do que você encontraria com uma distribuição normal. Mas, para manter o desvio padrão no mesmo valor, também devemos ter mais resíduos grandes (porque ter mais resíduos pequenos tornaria a distância típica da média menor). Para obter mais dos grandes e pequenos resíduos, você terá menos resíduos "de tamanho típico" - aqueles com cerca de um desvio padrão da média.‡
Uma curtose mais alta tende a resultar em resíduos maiores, mesmo quando você mantém a variação constante.
[Além disso, em alguns casos, a concentração de pequenos resíduos pode realmente levar a mais problemas do que a fração adicional dos maiores resíduos - dependendo do que você está vendo.]
Enfim, vejamos um exemplo. Considere um teste t de uma amostra e um tamanho de amostra 10.
Se rejeitarmos a hipótese nula quando o valor absoluto da estatística t for maior que 2.262, quando as observações forem independentes, distribuídas de forma idêntica a partir de uma distribuição normal, e a média hipotética for a verdadeira média populacional, rejeitaremos a nula hipótese 5% do tempo.
Considere uma distribuição específica com curtose substancialmente mais alta que a normal: 75% da nossa população têm seus valores extraídos de uma distribuição normal e os 25% restantes têm seus valores extraídos de uma distribuição normal com desvio padrão 50 vezes maior.
Se calculei corretamente, isso corresponde a uma curtose de 12 (excesso de curtose de 9). A distribuição resultante é muito mais alta que a normal e tem caudas pesadas. A densidade é comparada com a densidade normal abaixo - você pode ver o pico mais alto, mas não consegue ver a cauda mais pesada na imagem esquerda, então também plotei o logaritmo das densidades, que se estende pela parte inferior da a imagem e comprime a parte superior, facilitando a visualização do pico e da cauda.
O nível de significância real para esta distribuição se você realizar um teste t de uma amostra de "5%" comn = 10 está abaixo de 0,9%. Isso é bastante dramático e reduz substancialmente a curva de potência.
(Você também verá um efeito substantivo na cobertura dos intervalos de confiança.)
Observe que uma distribuição diferente com a mesma curtose que terá um impacto diferente no nível de significância.
Então, por que a taxa de rejeição diminui? É porque a cauda mais pesada leva a alguns outliers grandes, que têm um impacto um pouco maior no desvio padrão do que na média; isso afeta a estatística t porque leva a mais valores t entre -1 e 1, no processo, reduzindo a proporção de valores na região crítica.
Se você pegar uma amostra que parece bastante consistente com a origem de uma distribuição normal cuja média é suficientemente acima da média hipotética, ela é significativa e, em seguida, você leva a observação mais acima da média e a afasta ainda mais (ou seja, tornar a média ainda maior do que sobH0
Deixe-me te mostrar. Aqui está uma amostra do tamanho 10:
Agora faça esse valor maior 50:
Claramente, aumentamos a média, por isso deve indicar uma diferença ainda mais do que antes, certo? Bem, não, não faz. A estatística t diminui . Agora é 1.106, e o valor p é bastante grande (perto de 30%). O que aconteceu? Bem, aumentamos a média (para 7,257), mas o desvio padrão subiu mais de 15.
Os desvios padrão são um pouco mais sensíveis aos valores discrepantes do que os meios - quando você coloca um valor discrepante, tende a empurrar a estatística t de uma amostra para 1 ou -1.
Se houver uma chance de vários discrepantes, o mesmo acontece, apenas eles podem estar em lados opostos (nesse caso, o desvio padrão é ainda mais inflado, enquanto o impacto na média é reduzido em comparação com um discrepante), então a estatística t tende a se aproximar de 0.
Coisas semelhantes acontecem com vários outros testes comuns que assumem normalidade - a curtose mais alta tende a ser associada a caudas mais pesadas, o que significa mais discrepâncias, o que significa que os desvios padrão são inflados em relação às médias e, portanto, as diferenças que você deseja captar tendem a ficar "inundado" pelo impacto dos discrepantes no teste. Ou seja, baixa potência.
fonte
A curtose mede valores extremos. Os valores extremos são problemáticos para as inferências padrão (por exemplo, testes t, intervalos t) que são baseadas na distribuição normal. Esse é o fim da história! E é realmente uma história bastante simples.
A razão pela qual essa história não é bem apreciada é porque persiste o mito antigo de que a curtose mede "o pico".
Aqui está uma explicação simples que mostra por que a curtose mede valores extremos e não "pico".
Considere o seguinte conjunto de dados.
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1
Curtose é o valor esperado de (valores-z) ^ 4. Aqui estão os (valores z) ^ 4:
6,51, 0,30, 5,33, 0,45, 0,00, 0,30, 6,51, 0,00, 0,45, 0,30, 0,00, 6,51, 0,00, 0,00, 0,30, 0,00, 27,90, 0,00, 0,30, 0,45
A média é 2,78, e essa é uma estimativa da curtose. (Subtraia 3 se desejar excesso de curtose.)
Agora, substitua o último valor dos dados por 999 para que ele se torne um erro externo:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999
Agora, aqui estão os (valores z) ^ 4:
0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00,0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360,98
A média é 18,05, e essa é uma estimativa da curtose. (Subtraia 3 se desejar excesso de curtose.)
Claramente, apenas os discrepantes são importantes. Nada sobre o "pico" ou os dados próximos ao meio é importante.
Se você executar análises estatísticas padrão com o segundo conjunto de dados, deverá esperar problemas. A curtose grande alerta você para o problema.
Aqui está um artigo que elabora:
Westfall, PH (2014). Kurtosis as Peakedness, 1905 - 2014. RIP The American Statistician, 68, 191–195.
fonte
A curtose também indica caudas assimétricas. Em um teste de hipótese bicaudal, uma cauda será uma cauda longa e a outra será uma cauda curta. Uma das caudas pode ser> alfa, mas <beta. Uma cauda passaria o valor p, mas a outra não.
Basicamente, a inferência estatística assume um padrão normal. Quando não é um padrão normal, você pode se dar bem com uma inferência baseada em algumas mecânicas de inferência mais sofisticadas. Você pode ser capaz de nos deduzir Poisson, mas com uma distribuição que não é normal, não é possível usar inferência baseada em valores normais.
Inclinação e curtose são uma medida de não normalidade. Aprendemos a usar meios e usar distribuições normais antes de saber que precisamos testar a normalidade. Um normal requer 36 ou mais pontos de dados de cada dimensão. Você pode estimar em 20 pontos de dados, mas ainda terá inclinação e curtose. À medida que a distribuição se aproxima da normalidade, a inclinação e a distribuição desaparecem.
Uma das explicações definiu a curtose como pico. Outro não. Esta é uma luta instável neste momento. A curtose é o quarto momento, uma área. Estou no ponto alto da questão.
Outra idéia que existe é que, com uma inclinação, a mediana se inclina para o modo que forma um triângulo. Desfrutar.
fonte