Recentemente, comecei a ler Gelman e Hill, "Análise de dados usando regressão e modelos hierárquicos / multiníveis", e a pergunta se baseia nisso:
A amostra contém 6 observações em proporções:
Cada tem média e variância , em que é o número de observações usadas para calcular a proporção .
A estatística do teste é desvio padrão da amostra dessas proporções.
O livro diz que o valor esperado da variação da amostra das seis proporções, , é . Eu entendo tudo isso.
O que eu quero saber é a distribuição de e sua variação? Gostaria de saber se alguém poderia me informar o que é ou me orientar para um livro ou artigo que contenha essas informações.
Muito obrigado.
distributions
binomial
standard-deviation
Curious2learn
fonte
fonte
Respostas:
As distribuições exatas para as proporções são , e as proporções podem assumir os valores . A distribuição resultante do desvio padrão da amostra é uma distribuição discreta complicada. Deixando , ele pode ser escrito em sua forma mais trivial como:pi ~ Bin(ni,πi)/ni pi=0,1ni,2ni,...,ni−1ni,1 T p≡(p1,p2,...,p6)
onde é o conjunto de todos os vetores de proporção que levam a uma variação da amostra não superior a . Realmente não há como simplificar isso no caso geral. Para obter uma probabilidade exata dessa distribuição, é necessário enumerar os vetores de proporção que produzem uma variação de amostra no intervalo de interesse e somar os produtos binomiais nesse intervalo enumerado. Seria um exercício de cálculo oneroso para valores moderadamente grandes de .P(t)≡{p|T⩽t} t n1,...,n6
Agora, obviamente, a distribuição acima não é uma forma muito útil. Tudo o que realmente lhe diz é que você precisa enumerar os resultados de interesse e depois somar suas probabilidades. Por isso, seria incomum calcular probabilidades exatas nesse caso, e é muito mais fácil apelar para uma forma assintótica para a distribuição da variação da amostra.
fonte