Suponhamos que estou correndo uma experiência que pode ter 2 resultados, e estou assumindo que o subjacente "verdadeiro" distribuição dos resultados 2 é uma distribuição binomial com parâmetros e : .
Eu posso calcular o erro padrão, , a partir da forma da variância de :
onde. Então, . Para o erro padrão, recebo: , mas eu já vi em algum lugar que . O que eu fiz errado?
binomial
standard-error
Frank
fonte
fonte
Respostas:
Parece que você está usando duas vezes de duas maneiras diferentes - como o tamanho da amostra e o número de ensaios de bernoulli que compõem a variável aleatória Binomial; para eliminar qualquer ambiguidade, vou usar k para me referir a este último.n k
Se tiver amostras independentes de um B i n o m i a l ( k , p ) de distribuição, a variância da sua média da amostra én Binomial(k,p)
onde e ¯ X é a mesma média. Isto segue desdeq=1−p X¯¯¯¯
(1) ,var(cX)=c2var(X) para qualquer variável aleatória, e qualquer constante c .X c
(2) a variância de uma soma de variáveis aleatórias independentes é igual à soma das variâncias .
O erro padrão de é a raiz quadrada da variância: √X¯¯¯¯ . Assim sendo,kpqn−−−√
Quando , você obtém a fórmula que indicou: √k=n pq−−√
fonte
É fácil confundir duas distribuições binomiais:
npq é o número de sucessos, enquanto npq / n = pq é a razão de sucessos. Isso resulta em diferentes fórmulas de erro padrão.
fonte
Podemos analisar isso da seguinte maneira:
Agora, se olharmos para a variância de , . Mas, para todas as experiências individuais de Bernoulli, . Uma vez que existem jogadas ou ensaios de Bernoulli no experimento, . Isso implica que tem variação .Y V(Y)=V(∑Xi)=∑V(Xi) V(Xi)=pq n V(Y)=∑V(Xi)=npq Y npq
Agora, a proporção da amostra é dada por , que fornece a 'proporção de sucesso ou cabeças'. Aqui, é uma constante, pois planejamos fazer o mesmo número de lançamentos de moedas para todos os experimentos da população.p^=Yn n
Portanto, .V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n
Portanto, o erro padrão para (uma estatística de amostra) é √p^ pq/n−−−−√
fonte
$x$
dá .Eu acho que também há alguma confusão no post inicial entre erro padrão e desvio padrão. O desvio padrão é o sqrt da variação de uma distribuição; erro padrão é o desvio padrão da média estimada de uma amostra dessa distribuição, ou seja, a dispersão das médias que você observaria se fizesse essa amostra infinitamente várias vezes. O primeiro é uma propriedade intrínseca da distribuição; o último é uma medida da qualidade da sua estimativa de uma propriedade (a média) da distribuição. Quando você faz um experimento com os ensaios de N Bernouilli para estimar a probabilidade desconhecida de sucesso, a incerteza do valor estimado de p = k / N após ver k sucessos é um erro padrão da proporção estimada, sqrt (pq / N) em que q = 1 -p. A verdadeira distribuição é caracterizada por um parâmetro P, a verdadeira probabilidade de sucesso.
fonte