Suponha que w1,w2,…,wn e x1,x2,...,xn são cada iid extraído de algumas distribuições, com wi independente de xi . O wi é estritamente positivo. Você observa todo o wi , mas não o xi ; em vez disso você observa ∑ixiwi . Estou interessado em estimar E[x] partir desta informação. Claramente, o estimador
x¯=∑iwixi∑iwi
é imparcial, e pode ser calculada tendo em conta a informação na mão.
Como posso calcular o erro padrão deste estimador? Para o sub-caso em que xi obtém apenas os valores 0 e 1, tentei ingenuamente
se≈x¯(1−x¯)∑iw2i−−−−−−−−−−−−√∑iwi,
basicamente ignorando a variabilidade na
wi, mas descobriu que este mau desempenho de amostras de tamanho menor do que em torno de 250. (E isso provavelmente depende da variação do
.) Parece que talvez eu não fazer tenha informações suficientes para calcular um erro padrão 'melhor'.
wi
w=rep(1, length(x))
, entãoweighted.var.se(rnorm(50), rep(1, 50))
é sobre0.014
. Eu acho que falta a fórmulasum(w^2)
no numerador, desde quandoP=1
, a variação é1/(n*(n-1)) * sum((x-xbar)^2)
. Não posso verificar o artigo citado, pois está atrás de um paywall, mas acho essa correção. Curiosamente, a solução (diferente) da Wikipedia se deteriora quando todos os pesos são iguais: en.wikipedia.org/wiki/… .fonte