Erro padrão do desvio padrão da amostra de proporções

8

Recentemente, comecei a ler Gelman e Hill, "Análise de dados usando regressão e modelos hierárquicos / multiníveis", e a pergunta se baseia nisso:

A amostra contém 6 observações em proporções:p1,p2,,p6

Cada tem média e variância , em que é o número de observações usadas para calcular a proporção .piπiπi(1πi)ninipi

A estatística do teste é desvio padrão da amostra dessas proporções.Ti=

O livro diz que o valor esperado da variação da amostra das seis proporções, , é . Eu entendo tudo isso.p1,p2,,p6(1/6)i=16πi(1πi)/ni

O que eu quero saber é a distribuição de e sua variação? Gostaria de saber se alguém poderia me informar o que é ou me orientar para um livro ou artigo que contenha essas informações.Ti

Muito obrigado.

Curious2learn
fonte
Não tenho o livro para verificar, mas a declaração sobre o valor esperado da variação da amostra me parece estranha. Certamente também deve depender da variabilidade de 's. πi
Aniko
Uma estatística de teste é um valor de pesquisa para uma distribuição como t de Student, distribuição normal, distribuição F, etc. Procure no livro e encontre o nome da distribuição para essa estatística. A variação deve estar similarmente relacionada a isso.
Carl
Ninguém gostaria de saber a distribuição de precisamente porque é muito desagradável. Isso porque as proporções são discretas - pode assumir apenas os valores e, portanto, (não deve haver nenhum índice nele) também é discreto: mas seus possíveis valores, que são numerosos, não se enquadram em uma série de intervalos uniformemente espaçados. Sua variação não é muito difícil de calcular, porque é uma função dos primeiros quatro momentos de cada um dos e esses são relativamente simples de escrever. Tipi0/ni,1/ni,,ni/niTpi
whuber
@ Carl verdadeiro, e embora não seja uma resposta direta à pergunta da OP, vale a pena considerar. No entanto, às vezes distribuições exatas podem ser derivadas para estatísticas de teste, e elas podem fornecer melhores propriedades de amostra pequena dos testes correspondentes. Não espero que seja esse o caso.
AdamO 5/12

Respostas:

1

As distribuições exatas para as proporções são , e as proporções podem assumir os valores . A distribuição resultante do desvio padrão da amostra é uma distribuição discreta complicada. Deixando , ele pode ser escrito em sua forma mais trivial como:pi ~ Bin(ni,πi)/nipi=0,1ni,2ni,...,ni1ni,1Tp(p1,p2,...,p6)

FT(t)P(Tt)=pP(t)i=16Bin(nipi|ni,πi),

onde é o conjunto de todos os vetores de proporção que levam a uma variação da amostra não superior a . Realmente não há como simplificar isso no caso geral. Para obter uma probabilidade exata dessa distribuição, é necessário enumerar os vetores de proporção que produzem uma variação de amostra no intervalo de interesse e somar os produtos binomiais nesse intervalo enumerado. Seria um exercício de cálculo oneroso para valores moderadamente grandes de .P(t){p|Tt}tn1,...,n6

Agora, obviamente, a distribuição acima não é uma forma muito útil. Tudo o que realmente lhe diz é que você precisa enumerar os resultados de interesse e depois somar suas probabilidades. Por isso, seria incomum calcular probabilidades exatas nesse caso, e é muito mais fácil apelar para uma forma assintótica para a distribuição da variação da amostra.

Ben - Restabelecer Monica
fonte