Para variação não ponderada , existe a variação da amostra corrigida por viés, quando a média foi estimada a partir dos mesmos dados: Var(X):=1
Estou analisando a média ponderada e a variação, e imaginando qual é a correção de viés apropriada para a variação ponderada. Usando:
A variação "ingênua" e não corrigida que estou usando é a seguinte:
Então, eu estou me perguntando se a maneira correta de corrigir o viés é
A)
ou B)
ou C)
A) não faz sentido para mim quando os pesos são pequenos. O valor da normalização pode ser 0 ou até negativo. Mas e quanto a B) ( é o número de observações) - essa é a abordagem correta? Você tem alguma referência que mostra isso? Eu acredito "Atualizando estimativas de média e variância: um método aprimorado", DHD West, 1979 usa isso. O terceiro, C) é a minha interpretação da resposta a esta pergunta: /mathpro/22203/unbiated-estimate-of-the-variance-of-an-unnormalised-weighted-mean
Para C) acabei de perceber que o denominador se parece muito com . Existe alguma conexão geral aqui? Eu acho que não está totalmente alinhado; e obviamente existe a conexão que estamos tentando calcular a variação ...
Todos os três parecem "sobreviver" à verificação de sanidade de definir todos . Então, qual devo usar e em quais premissas? '' Update: '' whuber sugeriu também fazer a verificação de sanidade com e todos os restantes tiny. Isso parece excluir A e B.ω 1 = ω 2 = 0,5 ω i = ϵ
fonte
Respostas:
Passei pela matemática e acabei com a variante C:
fonte
Ambos A e C estão corretos, mas qual deles você usará depende de que tipo de pesos você usa:
A razão pela qual C é necessariamente tendenciosa é porque, se você não usar pesos do tipo "repetir", perderá a capacidade de contar o número total de observações (tamanho da amostra) e, portanto, não poderá usar um fator de correção.
Para mais informações, consulte o artigo da Wikipedia que foi atualizado recentemente: http://en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_variance
fonte