Independência da média da amostra e variância da amostra na distribuição binomial
9
Deixe . Sabemos que e . Isso implica que a média da amostra e a variação da amostra são dependentes uma da outra? Ou significa apenas que a variação da população pode ser escrita em função da média da população ?E [ X ] = n p V a r [ X ] = n p ( 1 - p )X~ B i n o m i a l ( n , p )E [X] = n pV a r [X] = n p ( 1 - p )x¯s2
x¯ e são variáveis aleatórias. Podemos calcular sua distribuição conjunta. Vamos tentar o caso não trivial mais simples possível, o de uma amostra de tamanho de uma distribuição Binomial . Existem apenas quatro possibilidades para essa amostra, que são tabuladas juntamente com suas probabilidades (calculadas a partir da independência dos dois elementos da amostra): 2 ( 1 , p )s22( 1 , p )
First value | Second value | Mean | Variance | Probability
0 | 0 | 0 | 0 | (1-p)^2
0 | 1 | 1/2 | 1/2 | (1-p)p
1 | 0 | 1/2 | 1/2 | p(1-p)
1 | 1 | 1 | 0 | p^2
A média prediz perfeitamente a variação neste exemplo. Assim, desde que todas as probabilidades sejam diferentes de zero (ou seja, não é nem ), a média da amostra e a variação da amostra não são independentes.0 1p0 01
Uma questão interessante é se, em uma família de distribuições, a média determina a variação, a média da amostra e a variação da amostra podem ser independentes. A resposta é sim: pegue qualquer família de distribuições Normais nas quais a variação depende da média, como o conjunto de todas as distribuições Normais . Não importa qual dessas distribuições governe a amostra, a média e a variação da amostra serão independentes, porque esse é o caso de qualquer distribuição Normal.( μ , μ2)
Essa análise sugere que questões sobre a estrutura de uma família de distribuições (que dizem respeito a , , etc.) não têm influência sobre questões de independência das estatísticas das amostras de qualquer elemento da família.p μnpμ
Mas talvez seja porque a distribuição normal é um caso "especial"? Quero dizer, sabe-se que, para qualquer distribuição normal, é verdade que a média da amostra é independente da variação da amostra. Mas o que acontece se estamos lidando com uma distribuição que não é uma distribuição normal?
user6874652
1
Normalmente, a média da amostra e a variação da amostra não são independentes. Não faz diferença de que família de distribuições a distribuição possa fazer parte.
whuber
@ whuber: Exceto que, com a média e a variação da amostra são independentes. N( μ , σ2)
Michael Hardy
@ Michael Obrigado. Eu já notei isso no corpo da resposta.
whuber
@ whuber: obrigado pela análise. Você também pode divulgar o Rcódigo? Muito Obrigado.
Maximilian
8
A propriedade que, para uma amostra iid, a média da amostra e a variação da amostra são independentes, é uma caracterização da distribuição normal: para nenhuma outra distribuição essa propriedade é válida.
Portanto, para qualquer outra distribuição, a média da amostra e a variação da amostra são estatisticamente dependentes.
O resultado geral referente à média da amostra e à variação da amostra de uma amostra de qualquer distribuição que tenha momentos até o 3d é o seguinte (usando o estimador imparcial para a variação):
Cov( X¯, s2) = E( X¯s2) - E( X ) Var( x ) = 1nE[ X- E( x ) ]3
Em palavras, a covariância entre a média da amostra e a variância da amostra é igual ao terceiro momento central, dividido por . Consequências: n
1) À medida que o tamanho da amostra aumenta, os dois tendem a se tornar não correlacionados.
2) Para qualquer distribuição que tenha o terceiro momento central igual a zero, elas não são correlacionadas (embora permaneçam dependentes, para todas as distribuições, exceto a normal). É claro que isso inclui todas as distribuições simétricas sobre sua média, mas também outras distribuições que não são simétricas sobre sua média, mas que ainda têm o terceiro momento central igual a zero , veja este tópico .
@COOLSerdash Funciona para mim. É um link para uma página da Amazon, talvez isso esteja bloqueado para você?
Graipher
@COOLSerdash Thanks. Como mencionado, o hiperlink parece válido. Basta procurar "Manual de distribuição normal Patel Read".
Alecos Papadopoulos
(+1) Suspeitei que esse poderia ser o caso, mas nunca vi uma declaração formal desse fato. Existem distribuições não normais para as quais a média e a variação da amostra não estão correlacionadas?
John Coleman
1
@AlecosPapadopoulos Sim, é claro. Nesse caso, seria um exemplo interessante de quando não correlacionado não implica independente. Ainda não elaborei todos os detalhes, mas U(0,1)parece funcionar.
R
código? Muito Obrigado.A propriedade que, para uma amostra iid, a média da amostra e a variação da amostra são independentes, é uma caracterização da distribuição normal: para nenhuma outra distribuição essa propriedade é válida.
Ver Patel, JK, & Read, CB (1982). Manual da distribuição normal , p. 81 na 1ª edição de 1982, no capítulo "Caracterizações" (pode ter mudado de página na 2ª edição de 1996).
Portanto, para qualquer outra distribuição, a média da amostra e a variação da amostra são estatisticamente dependentes.
O resultado geral referente à média da amostra e à variação da amostra de uma amostra de qualquer distribuição que tenha momentos até o 3d é o seguinte (usando o estimador imparcial para a variação):
Em palavras, a covariância entre a média da amostra e a variância da amostra é igual ao terceiro momento central, dividido por . Consequências:n
1) À medida que o tamanho da amostra aumenta, os dois tendem a se tornar não correlacionados.
2) Para qualquer distribuição que tenha o terceiro momento central igual a zero, elas não são correlacionadas (embora permaneçam dependentes, para todas as distribuições, exceto a normal). É claro que isso inclui todas as distribuições simétricas sobre sua média, mas também outras distribuições que não são simétricas sobre sua média, mas que ainda têm o terceiro momento central igual a zero , veja este tópico .
fonte
U(0,1)
parece funcionar.fonte