Exemplo de distribuição onde um tamanho grande de amostra é necessário para o teorema do limite central

Alguns livros afirmam que um tamanho de amostra de tamanho 30 ou superior é necessário para que o teorema do limite central forneça uma boa aproximação para . $\bar{X}$

Eu sei que isso não é suficiente para todas as distribuições.

Desejo ver alguns exemplos de distribuições em que, mesmo com um grande tamanho de amostra (talvez 100, 1000 ou mais), a distribuição da média da amostra ainda é bastante distorcida.

Sei que já vi esses exemplos antes, mas não me lembro onde e não consigo encontrá-los.

mean sample-size normality-assumption central-limit-theorem Graphth
fonte

Considere uma distribuição gama com o parâmetro de forma . Pegue a escala como 1 (não importa). Digamos que você considere apenas como "suficientemente normal". Em seguida, uma distribuição para a qual você precisa que 1000 observações sejam suficientemente normais tem uma distribuição .

α

$\alpha$

Gamma (α_{0}, 1)

$\text{Gamma}(\alpha_0,1)$

Gamma (α_{0} / 1000, 1)

$\text{Gamma}(\alpha_0/1000,1)$

Glen_b -Reinstar Monica

@Glen_b, por que não fazer disso uma resposta oficial e desenvolvê-la um pouco?

gung - Restabelece Monica

Qualquer distribuição suficientemente contaminada funcionará, da mesma forma que o exemplo de @ Glen_b. Por exemplo , quando a distribuição subjacente é uma mistura de Normal (0,1) e Normal (valor enorme, 1), com o último tendo apenas uma pequena probabilidade de aparecer, coisas interessantes acontecem: (1) na maioria das vezes , a contaminação não aparece e não há evidência de assimetria; mas (2) às vezes a contaminação aparece e a assimetria na amostra é enorme. A distribuição da média da amostra será altamente inclinada, independentemente, mas a inicialização ( por exemplo ) normalmente não a detectará.

whuber

O exemplo de @ whuber é instrutivo, mostrando que o teorema do limite central pode, em teoria, ser arbitrariamente enganoso. Em experimentos práticos, suponho que é preciso perguntar-se se poderia haver algum efeito enorme que ocorre muito raramente e aplicar o resultado teórico com um pouco de cautela.

David Epstein

Respostas:

Alguns livros afirmam que um tamanho de amostra de tamanho 30 ou superior é necessário para que o teorema do limite central forneça uma boa aproximação para . $\bar{X}$

Essa regra geral é praticamente completamente inútil. Existem distribuições não normais para as quais n = 2 fará distribuições normais e não normais para as quais muito maior é insuficiente - portanto, sem uma restrição explícita às circunstâncias, a regra é enganosa. De qualquer forma, mesmo que fosse verdade, o necessário variaria dependendo do que você estava fazendo. Frequentemente, você obtém boas aproximações perto do centro da distribuição em pequeno , mas precisa de muito maior para obter uma aproximação decente na cauda. $n$ $n$ $n$ $n$

Editar: Veja as respostas a esta pergunta para opiniões numerosas, mas aparentemente unânimes sobre esse assunto, e alguns bons links. Não vou insistir no assunto, já que você já o entende claramente.

Estou querendo ver alguns exemplos de distribuições em que, mesmo com um tamanho de amostra grande (talvez 100 ou 1000 ou superior), a distribuição da média da amostra ainda seja bastante distorcida.

Exemplos são relativamente fáceis de construir; Uma maneira fácil é encontrar uma distribuição infinitamente divisível que não seja normal e dividi-la. Se você tem um que se aproxima do normal quando faz a média ou o resumo, comece no limite de 'próximo ao normal' e divida-o quanto quiser. Então, por exemplo:

Considere uma distribuição gama com o parâmetro de forma . Pegue a escala como 1 (escala não importa). Digamos que você considere como "suficientemente normal". Então, uma distribuição para a qual você precisa obter 1000 observações para ser suficientemente normal possui uma distribuição . $α$ $\text{Gamma}(α_0,1)$ $\text{Gamma}(α_0/1000,1)$

Portanto, se você achar que um Gamma com é apenas 'normal o suficiente' - $\alpha=20$

Gamma (20) pdf

Em seguida, divida por 1000, para obter : $\alpha=20$ $\alpha = 0.02$

Gama (0,02) pdf

A média de 1000 delas terá a forma do primeiro pdf (mas não a sua escala).

Se você escolher uma distribuição infinitamente divisível que não se aproxima do normal, como o Cauchy, talvez não haja tamanho de amostra no qual os meios de amostra tenham distribuições aproximadamente normais (ou, em alguns casos, eles ainda podem se aproximar da normalidade, mas você não tem um efeito para o erro padrão). $\sigma/\sqrt n$

O argumento do @ whuber sobre distribuições contaminadas é muito bom; pode ser bom tentar algumas simulações nesse caso e ver como as coisas se comportam em muitas dessas amostras.

Glen_b -Reinstate Monica
fonte

Além das muitas ótimas respostas fornecidas aqui, Rand Wilcox publicou excelentes trabalhos sobre o assunto e mostrou que nossa verificação típica da adequação da aproximação normal é bastante enganadora (e subestima o tamanho da amostra necessário). Ele destaca que a média pode ser aproximadamente normal, mas isso é apenas metade da história quando não conhecemos o . Quando é desconhecido, normalmente usamos a distribuição para testes e limites de confiança. A variação da amostra pode estar muito, muito longe de uma distribuição escalonada e a relação resultante pode não parecer nada com uma distribuição quando $\sigma$ $\sigma$ $t$ $\chi^2$ $t$ $t$ $n=30$ . Simplificando, a não normalidade bagunça mais do que bagunça . $s^2$ $\bar{X}$

Frank Harrell
fonte

Este é um bom ponto a ser destacado; Na maioria das vezes, não é exatamente o meio pelo qual as pessoas lidam, mas algumas funções e outras coisas. No entanto, não é apenas que pode ser confuso - você também perde a independência do numerador e denominador, e isso pode ter alguns efeitos surpreendentes nas caudas.

s^{2}

$s^2$

Glen_b -Reinstar Monica

Você pode achar este documento útil (ou pelo menos interessante):

http://www.umass.edu/remp/Papers/Smith&Wells_NERA06.pdf

Os pesquisadores da UMass realizaram um estudo semelhante ao que você está perguntando. Em que tamanho de amostra determinados dados distribuídos seguem uma distribuição normal devido ao CLT? Aparentemente, muitos dados coletados para experimentos de psicologia não estão nem perto do normal, então a disciplina depende muito do CLT para fazer qualquer inferência em suas estatísticas.

Primeiro, eles executaram testes com dados uniformes, bimodais e uma distribuição normal. Usando Kolmogorov-Smirnov, os pesquisadores testaram quantas das distribuições foram rejeitadas por normalidade no nível . $\alpha = 0.05$

Table 2. Percentage of replications that departed normality based on the KS-test. 
 Sample Size 
           5   10   15   20   25  30 
Normal   100   95   70   65   60  35 
Uniform  100  100  100  100  100  95 
Bimodal  100  100  100   75   85  50

Curiosamente, 65% dos dados distribuídos normalmente foram rejeitados com um tamanho de amostra de 20 e mesmo com um tamanho de amostra de 30, 35% ainda foram rejeitados.

Eles então testaram várias distribuições fortemente distorcidas criadas usando o método de potência de Fleishman:

$Y = aX + bX^2 +cX^3 + dX^4$

X representa o valor obtido da distribuição normal, enquanto a, b, c e d são constantes (observe que a = -c).

Eles fizeram os testes com amostras de até 300

Skew  Kurt   A      B      C       D 
1.75  3.75  -0.399  0.930  0.399  -0.036 
1.50  3.75  -0.221  0.866  0.221   0.027 
1.25  3.75  -0.161  0.819  0.161   0.049 
1.00  3.75  -0.119  0.789  0.119   0.062

Eles descobriram que nos níveis mais altos de inclinação e kurt (1,75 e 3,75), tamanhos de amostra de 300 não produziam meios de amostra que seguiam uma distribuição normal.

Infelizmente, não acho que seja exatamente isso que você está procurando, mas me deparei com isso e achei interessante, e achei que você também poderia.

Eric Peterson
fonte

" Curiosamente, 65% dos dados normalmente distribuídos foram rejeitados com um tamanho de amostra de 20 e mesmo com um tamanho de amostra de 30, 35% ainda foram rejeitados. " - então parece que eles estão usando o teste errado; como um teste de normalidade em dados normais completamente especificados (que é o objetivo do teste), se eles estiverem usando corretamente, deve ser exato .

Glen_b -Reinstala Monica

@ Glen_b: Existem várias fontes de erro em potencial aqui. Se você ler o documento, notará que o que está listado como "normal" aqui são na verdade variáveis aleatórias normais com média 50 e desvio padrão de 10 arredondado para o número inteiro mais próximo . Portanto, nesse sentido, o teste usado já está usando uma distribuição especificada incorretamente. Segundo, ainda parece que eles realizaram os testes incorretamente, pois minhas tentativas de replicação mostram que, para uma amostra média, usando 20 dessas observações, a probabilidade de rejeição é de cerca de 27%. (continuação)

cardeal

(cont.) Terceiro, independentemente do acima, alguns softwares podem usar a distribuição assintótica e não a real, embora em tamanhos de amostra de 10K isso não deva importar muito (se os vínculos não tivessem sido artificialmente induzidos nos dados). Finalmente, encontramos a seguinte declaração bastante estranha no final do documento: Infelizmente, as propriedades do teste KS no S-PLUS limitam o trabalho. Os valores de p para o presente estudo foram todos compilados à mão sobre as múltiplas repetições. É necessário um programa para calcular os valores-p e julgá-los em comparação com o nível alfa escolhido.

cardeal

Olá @Glen_b. Não acredito que o arredondamento reduza a taxa de rejeição aqui porque acredito que eles estavam testando contra a verdadeira distribuição normal padrão usando os dados arredondados (que é o que eu quis dizer ao dizer que o teste usou uma distribuição mal especificada). (Talvez você estivesse pensando em usar o teste KS em uma distribuição discreta.) O tamanho da amostra para o teste KS era 10000, não 20; eles fizeram 20 repetições no tamanho da amostra 10000 cada para obter a tabela. Pelo menos, esse foi o meu entendimento da descrição ao examinar o documento.

cardeal

@ cardinal - você está correto, é claro, então talvez isso possa ser a fonte de uma parte substancial das rejeições em amostras de grandes tamanhos. Re: " O tamanho da amostra para o teste KS foi 10000, não 20 " ... ok, isso está soando cada vez mais estranho. Fica-se perguntando por que eles acham que qualquer uma dessas condições tem muito valor, em vez de dizer o contrário.

Glen_b -Reinstar Monica