Para testes t, de acordo com a maioria dos textos, há uma suposição de que os dados da população são normalmente distribuídos. Não vejo por que isso é. Um teste t não exige apenas que a distribuição amostral da média amostral seja normalmente distribuída, e não a população?
Se o teste t exigir apenas normalidade na distribuição amostral, a população pode se parecer com qualquer distribuição, certo? Contanto que haja um tamanho de amostra razoável. Não é isso que afirma o teorema do limite central?
(Estou me referindo aqui aos testes t de uma amostra ou amostras independentes)
Respostas:
A estatística t consiste em uma razão de duas quantidades, ambas variáveis aleatórias. Não consiste apenas de um numerador.
Para que a estatística t tenha a distribuição t, você não precisa apenas que a média da amostra tenha uma distribuição normal. Você também precisa:
que no denominador seja tal que *s 2 / σ 2 ~ χ 2 ds s2/ σ2∼ χ2d
que o numerador e o denominador sejam independentes.
* (o valor de depende de qual teste - na amostra temos )t d = n - 1d t d= n - 1
Para que essas três coisas sejam realmente verdadeiras, é necessário que os dados originais sejam normalmente distribuídos.
Vamos considerar o iid como dado por um momento. Para que o CLT mantenha a população, deve atender às condições ... - a população deve ter uma distribuição à qual o CLT se aplica. Portanto, não, pois existem distribuições populacionais às quais o CLT não se aplica.
Não, o CLT na verdade não diz uma palavra sobre "tamanho razoável da amostra".
Na verdade, nada diz sobre o que acontece em qualquer tamanho finito de amostra.
Estou pensando em uma distribuição específica agora. É a que o CLT certamente se aplica. Mas em , a distribuição da média da amostra é claramente não normal. No entanto, duvido que qualquer amostra da história da humanidade tenha tido tantos valores nela. Então - fora da tautologia - o que significa 'razoável '? nn = 1015 n
Então você tem dois problemas:
R. O efeito que as pessoas geralmente atribuem ao CLT - a abordagem cada vez mais próxima da normalidade das distribuições das médias das amostras em tamanhos de amostra pequenos / moderados - não é realmente declarado no CLT **.
B. "Algo não tão distante do normal no numerador" não é suficiente para obter a estatística com uma distribuição t
** (Algo como o teorema de Berry-Esseen deixa você mais parecido com o que as pessoas estão vendo quando observam o efeito do aumento do tamanho da amostra na distribuição das médias das amostras.)
O teorema de CLT e Slutsky fornece a você (contanto que todas as suposições deles) que, como , a distribuição da estatística t se aproxima do padrão normal. Não diz se um finito pode ser suficiente para algum propósito.nn → ∞ n
fonte