Eu tenho uma média mensal para um valor e um desvio padrão correspondente a essa média. Agora estou computando a média anual como a soma das médias mensais, como posso representar o desvio padrão da média somada?
Por exemplo, considerando a produção de um parque eólico:
Month MWh StdDev
January 927 333
February 1234 250
March 1032 301
April 876 204
May 865 165
June 750 263
July 780 280
August 690 98
September 730 76
October 821 240
November 803 178
December 850 250
Podemos dizer que no ano médio o parque eólico produz 10.358 MWh, mas qual é o desvio padrão correspondente a esse valor?
[ASK QUESTION]
no topo e faça a pergunta lá, então podemos ajudá-lo adequadamente. Como você é novo aqui, convém fazer um tour , que contém informações para novos usuários.Respostas:
Resposta curta: você calcula a média das variações ; então você pode usar a raiz quadrada para obter o desvio padrão médio .
Exemplo
E então o desvio padrão médio é
sqrt(53,964) = 232
De Soma das variáveis aleatórias distribuídas normalmente :
E da distribuição normal da soma de Wolfram Alpha :
Para seus dados:
10,358 MWh
647,564
804.71 ( sqrt(647564) )
Então, para responder sua pergunta:
Você os soma quadraticamente:
Conceitualmente, você soma as variações e pega a raiz quadrada para obter o desvio padrão.
Porque eu estava curioso, eu queria saber a média mensal médio de energia, e seu desvio padrão . Por indução, precisamos de 12 distribuições normais que:
10,358
647,564
Seriam 12 distribuições mensais médias de:
10,358/12 = 863.16
647,564/12 = 53,963.6
sqrt(53963.6) = 232.3
Podemos verificar nossas distribuições médias mensais adicionando-as 12 vezes, para ver se são iguais à distribuição anual:
863.16*12 = 10358 = 10,358
( correto )53963.6*12 = 647564 = 647,564
( correta )Edit : Movi o curto, direto ao ponto, responda de cima. Porque eu precisava fazer isso de novo hoje, mas queria verificar novamente se eu calculo a média das variações .
fonte
Esta é uma pergunta antiga, mas a resposta aceita não está correta ou completa. O usuário deseja calcular o desvio padrão nos dados de 12 meses em que a média e o desvio padrão já são calculados a cada mês. Supondo que o número de amostras em cada mês seja o mesmo, é possível calcular a média e a variação da amostra ao longo do ano a partir dos dados de cada mês. Para simplificar, assuma que temos dois conjuntos de dados:
com valores conhecidos da média e variância da amostra, , , , .μx μy σ2x σ2y
Agora queremos calcular as mesmas estimativas para
Considere que , são calculados como:μx σ2x
Para estimar a média e a variação sobre o conjunto total, precisamos calcular:
Portanto, se você tiver a variação de cada subconjunto e desejar a variação de todo o conjunto, poderá calcular a média de variações de cada subconjunto, se todas tiverem a mesma média. Caso contrário, você precisará adicionar a variação da média de cada subconjunto.
Digamos que durante a primeira metade do ano produzimos exatamente 1000 MWh por dia e, na segunda metade, produzimos 2000 MWh por dia. Então a média e a variação da produção de energia na primeira e na segunda metade são 1000 e 2000 para a média e a variação é 0 para ambas as metades. Agora, há duas coisas diferentes nas quais podemos estar interessados:
1- Queremos calcular a variação da produção de energia durante todo o ano : então, calculando a média das duas variações, chegamos a zero, o que não é correto, pois a energia por dia durante todo o ano não é constante. Nesse caso, precisamos adicionar a variação de todas as médias de cada subconjunto. Matematicamente, neste caso, a variável aleatória de interesse é a produção de energia por dia. Temos estatísticas de amostra sobre subconjuntos e queremos calcular as estatísticas de amostra por mais tempo.
2- Queremos calcular a variação da produção de energia por ano: Em outras palavras, estamos interessados em quanta produção de energia muda de um ano para outro ano. Nesse caso, a média da variação leva à resposta correta, que é 0, pois em cada ano produzimos exatamente 1500 MHW em média. Matematicamente, neste caso, a variável aleatória de interesse é a média da produção de energia por dia, em que a média é feita durante todo o ano.
fonte
Acredito que você possa estar realmente interessado no erro padrão e não no desvio padrão.
O erro padrão da média (MEV) é o desvio padrão da estimativa da média da amostra de uma média populacional e isso fornecerá uma medida de quão boa é a sua estimativa anual de MWh.
fonte
Gostaria de enfatizar novamente a incorreta parte da resposta aceita. A redação da pergunta leva à confusão.
A pergunta tem Average e StdDev de cada mês, mas não está claro que tipo de subconjunto é usado. É a média de 1 turbina eólica de toda a fazenda ou a média diária de toda a fazenda? Se for a média diária de cada mês, não será possível adicionar a média mensal para obter a média anual porque eles não têm o mesmo denominador. Se é a média da unidade, a pergunta deve indicar
Ao invés de
Além disso, o desvio ou variância padrão é a comparação com a média do próprio conjunto. NÃO contém nenhuma informação sobre a média de todo o conjunto.
A imagem não é necessária muito correta, mas transmite a ideia geral. Vamos imaginar a saída de 1 parque eólico como na imagem. Como você pode ver, a variação "local" não tem nada a ver com a variação "global", não importa como você os adicione ou multiplique. Você não pode prever a variação do ano usando a variação de 2 semestres. Portanto, na resposta aceita, enquanto o cálculo da soma estiver correto, a divisão por 12 para obter o número mensal não significa nada. . Das três seções, a primeira e a última seção estão erradas, a segunda está certa.
Novamente, é uma aplicação muito errada, por favor, não a siga ou isso causaria problemas. Apenas calculado para a coisa toda, usando a produção total anual / mensal de cada unidade como pontos de dados, dependendo do número anual ou mensal, essa deve ser a resposta correta. Você provavelmente quer algo assim. Este é meus números gerados aleatoriamente. Se você tiver os dados, o resultado na célula O2 deve ser sua resposta.
fonte