Como representar o uso de kWh por ano em relação à temperatura média?

9

Apenas por diversão, quero traçar meu consumo mensal de energia doméstica ano após ano. No entanto, desejo incluir alguma referência à temperatura mensal, para que eu possa determinar se minha casa ou comportamento está melhorando, piorando ou mantendo-se estável em relação ao uso de kWh.

Os dados com os quais estou trabalhando:

+----------+--------+-----------+----------------+----------+-----------+------------+
|  Month   | # Days | kWh Usage | Daily kWh Avg. | Avg. Low | Avg. High | Avg. Temp. |
+----------+--------+-----------+----------------+----------+-----------+------------+
| Mar 2015 |     32 |      1048 |             33 |       40 |        60 |         50 |
| Feb 2015 |     29 |      1156 |             40 |       32 |        54 |         43 |
| Jan 2015 |     33 |      1143 |             35 |       38 |        57 |         47 |
| Dec 2014 |     30 |       887 |             30 |       39 |        61 |         50 |
| Nov 2014 |     29 |       645 |             22 |       45 |        67 |         56 |
| Oct 2014 |     29 |       598 |             21 |       60 |        78 |         69 |
| Sep 2014 |     32 |       893 |             28 |       70 |        85 |         77 |
| Aug 2014 |     30 |       965 |             32 |       72 |        87 |         79 |
| Jul 2014 |     29 |       784 |             27 |       72 |        87 |         79 |
| Jun 2014 |     32 |      1018 |             32 |       69 |        87 |         78 |
| May 2014 |     30 |       702 |             23 |       63 |        82 |         72 |
| Apr 2014 |     33 |       722 |             22 |       50 |        71 |         60 |
| Mar 2014 |     29 |       830 |             29 |       41 |        62 |         52 |
| Feb 2014 |     28 |      1197 |             43 |       32 |        52 |         42 |
| Jan 2014 |     33 |      1100 |             33 |       38 |        59 |         49 |
| Dec 2013 |     30 |       856 |             29 |       40 |        63 |         51 |
| Nov 2013 |     33 |       686 |             21 |       48 |        70 |         59 |
| Oct 2013 |     30 |       527 |             18 |       61 |        77 |         69 |
| Sep 2013 |     30 |       817 |             27 |       69 |        86 |         77 |
| Aug 2013 |     28 |       991 |             35 |       72 |        86 |         79 |
| Jul 2013 |     31 |       993 |             32 |       73 |        86 |         79 |
| Jun 2013 |     30 |       847 |             28 |       66 |        83 |         74 |
| May 2013 |     29 |       605 |             21 |       59 |        76 |         67 |
| Apr 2013 |     34 |       791 |             23 |       47 |        66 |         57 |
+----------+--------+-----------+----------------+----------+-----------+------------+

Comecei com um gráfico de colunas comparando facilmente os valores mês a mês:

Gráfico de colunas de uso mês a mês

Eu imaginei uma boa área de plano de fundo ou gráfico de linhas mapeado para um eixo vertical secundário (direito) mostrando as faixas alta / baixa, mas percebi que isso seria problemático com os agrupamentos plurianuais.

Seria fácil com um único ano:

2014 kWh Uso com temperaturas

Estou curioso para saber se alguém pode recomendar uma maneira de combinar todos os dados anuais em um único gráfico com comparações de temperatura?

Existe alguma relação que eu possa usar que possa efetivamente relacionar o uso de kWh à temperatura média ... ou alguma outra técnica de exibição que eu esteja ignorando ... ou estou preso a um gráfico por ano?

Shawn
fonte

Respostas:

18

Gostaria de sugerir que o importante é desenvolver um modelo de custo de energia fisicamente realista e praticamente útil . Isso funcionará melhor para detectar mudanças nos custos do que qualquer visualização dos dados brutos pode realizar. Ao comparar isso com a solução oferecida no SO , temos um bom estudo de caso sobre a diferença entre ajustar uma curva aos dados e realizar uma análise estatística significativa.

(Essa sugestão baseia-se em ajustar esse modelo ao meu uso doméstico há uma década e aplicá-lo para rastrear alterações durante esse período. Observe que, uma vez que o modelo está em forma, ele pode ser facilmente calculado em uma planilha para fins de rastreamento alterações, portanto, não devemos nos sentir limitados pelos (in) recursos do software de planilha.)

Para esses dados, esse modelo fisicamente plausível produz uma imagem substancialmente diferente dos custos de energia e padrões de uso do que um modelo alternativo simples (um ajuste quadrático de mínimos quadrados do uso diário em relação à temperatura média mensal). Consequentemente, o modelo mais simples não pode ser considerado uma ferramenta confiável para entender, prever ou comparar padrões de uso de energia.


Análise

A Lei de Newton de Resfriamento diz que, para uma boa aproximação, o custo do aquecimento (durante uma unidade de tempo) deve ser diretamente proporcional à diferença entre a temperatura externa e a temperatura interna . Que essa constante de proporcionalidade seja . O custo do resfriamento também deve ser proporcional a essa diferença de temperatura, com uma constante de proporcionalidade semelhante - mas não necessariamente idêntica - . (Cada uma delas é determinada pela capacidade de isolamento da casa, bem como pelas eficiências dos sistemas de aquecimento e refrigeração.)t 0 - αtt0αβ

A estimativa de e (que são expressos em kilowatts (ou dólares) por grau por unidade de tempo) está entre as coisas mais importantes que podem ser realizadas,αβ porque nos permitem prever custos futuros e medir a eficiência da casa e seus sistemas de energia.

Como esses dados são o uso total de eletricidade, incluem custos de não aquecimento, como iluminação, culinária, computação e entretenimento. Também é interessante uma estimativa desse uso médio de energia base (por unidade de tempo), que chamarei de : fornece um piso sobre quanta energia pode ser economizada e permite previsões de custos futuros quando melhorias de eficiência de magnitude conhecida são feitas . (Por exemplo, depois de quatro anos, substituí um forno por um que alegava ser 30% mais eficiente - e era exatamente isso.)γ

Finalmente, como uma aproximação (bruta), assumirei que a casa é mantida a uma temperatura quase constante ao longo do ano. (No meu modelo pessoal, assumo duas temperaturas, , para o inverno e o verão, respectivamente - mas ainda não existem dados suficientes neste exemplo para estimar os dois de maneira confiável e estariam bem próximos de qualquer maneira.) O valor ajuda a avaliar as conseqüências de manter a casa em uma temperatura ligeiramente diferente, que é uma importante opção de economia de energia.t0t0t1

Os dados apresentam uma complicação singularmente importante e interessante : refletem os custos totais durante períodos em que as temperaturas externas flutuam - e flutuam muito, geralmente cerca de um quarto da faixa anual a cada mês. Como veremos, isso cria uma diferença substancial entre o modelo instantâneo subjacente correto descrito e os valores dos totais mensais. O efeito é especialmente pronunciado nos meses intermediários, onde ocorrem aquecimento (ou nenhum) de aquecimento e resfriamento. Qualquer modelo que não responda a essa variação erroneamente "pensaria" que os custos de energia deveriam estar na taxa básica durante qualquer mês com uma temperatura média de , mas a realidade é muito diferente.γt0

Não temos (prontamente) informações detalhadas sobre as flutuações mensais de temperatura além de seus intervalos. Proponho lidar com isso com uma abordagem prática, mas um pouco inconsistente. Exceto em temperaturas extremas, todos os meses geralmente experimentam aumentos ou diminuições graduais de temperatura. Isso significa que podemos considerar a distribuição aproximadamente uniforme. Quando o intervalo de uma variável uniforme possui comprimento , essa variável possui um desvio padrão de . I usar esta relação para converter os intervalos (de a ) para os desvios padrão. Porém, essencialmente, para obter um modelo bem comportado, reduzirei a ponderação da variação no final desses intervalos usando NormalLs=L/6Avg. LowAvg. Highdistribuições (com esses SDs estimados e meios dados por Avg. Temp).

Finalmente, devemos padronizar os dados para um tempo de unidade comum. Embora isso já esteja presente na Daily kWh Avg.variável, ele não tem precisão, então vamos dividir o total pelo número de dias para recuperar a precisão perdida.

Assim, o modelo de resfriamento em tempo unitário custa a uma temperatura externa de éYt

y(t)=γ+α(tt0)I(t<t0)+β(tt0)I(t>t0)+ε(t)

onde é a função do indicador e representa tudo que não explicitamente capturado neste modelo. Ele tem quatro parâmetros para estimar: e . (Se você realmente tem certeza de pode fixar seu valor em vez de estimar.)Iεα,β,γt0t0

Os custos totais relatados durante um período de tempo a quando a temperatura varia com o tempo serão, portanto,x0x1t(x)x

Cost(x0,x1)=x0x1y(t)dt=x0x1(γ+α(t(x)t0)I(t(x)<t0)+β(t(x)t0)I(t(x)>t0)+ε(t(x)))t(x)dx.

Se o modelo é bom, as flutuações em devem ter uma média de um valor próximo a zero e parecerão mudar aleatoriamente mês a mês. Aproximando as flutuações em com uma distribuição Normal da média (a média mensal) e desvio padrão (conforme fornecido anteriormente no intervalo mensal) e fazendo as integrais produzemε(t)ε¯t(x)t¯s(t¯)

y¯(t¯)=γ+(βα)s(t¯)2ϕs(t¯t0)+(t¯t0)(β+(αβ)Φs(t0t¯))+ε¯(t¯).

Nesta fórmula, é a distribuição cumulativa de uma variável Normal de média zero e desvio padrão ; é sua densidade.Φss(t¯)ϕ


Modelo de montagem

Este modelo, embora expresse uma relação não linear entre custos e temperatura, é linear nas variáveis e . No entanto, como não é linear em e não é conhecido, precisamos de um procedimento de ajuste não linear. Para ilustrar, simplesmente coloquei-o em um maximizador de probabilidade (usando para o cálculo), assumindo que o seja independente e distribuído de forma idêntica, com distribuições normais de zero médio e desvio padrão comum .γ t 0 t 0 ˉ ε σα,β,γt0t0Rε¯σ

Para esses dados, as estimativas são

(α^,β^,γ^,t0^,σ^)=(1.489,1.371,10.2,63.4,1.80).

Isso significa:

  • O custo do aquecimento é de aproximadamente kWh / dia / grau F.1.49

  • O custo para resfriar é de aproximadamente kWh / dia / grau F. O resfriamento é um pouco mais eficiente.1.37

  • O uso de energia básica (sem aquecimento / resfriamento) é de kWh / dia. (Esse número é bastante incerto; dados adicionais ajudarão a identificá-lo melhor.)10.2

  • A casa é mantida a uma temperatura próxima de graus F.63.4

  • As demais variações não explicitamente explicadas no modelo apresentam um desvio padrão de kWh / dia.1.80

Intervalos de confiança e outras expressões quantitativas de incerteza nessas estimativas podem ser obtidas de maneiras padrão com o mecanismo de máxima verossimilhança.


Visualização

Para ilustrar esse modelo, a figura a seguir plota os dados, o modelo subjacente, o ajuste às médias mensais e um ajuste quadrático de mínimos quadrados simples.

Figura

Os dados mensais são mostrados como cruzes escuras. As linhas horizontais cinzas nas quais se encontram mostram as faixas mensais de temperatura. Nosso modelo subjacente, refletindo a lei de Newton, é mostrado pelos segmentos de linha vermelha e azul que se encontram a uma temperatura de . Nosso ajuste aos dados não é uma curva , porque depende das faixas de temperatura. É mostrado, portanto, como pontos individuais azuis e vermelhos sólidos. (No entanto, como os intervalos mensais não variam muito, esses pontos parecem traçar uma curva - quase o mesmo que a curva quadrática pontilhada.) )t0

Observe o quanto os ajustes se afastam do modelo subjacente (instantâneo), especialmente nas temperaturas médias! Este é o efeito da média mensal. (Pense nas alturas das linhas vermelha e azul sendo "borradas" em cada segmento cinza horizontal. Em temperaturas extremas, tudo fica centralizado nas linhas, mas a temperaturas médias, os dois lados do "V" são calculados em média, refletindo a necessidade para aquecer algumas vezes e esfriar outras vezes durante o mês.)


Comparação de modelos

Os dois ajustes - aquele desenvolvido minuciosamente aqui e o ajuste simples, fácil e quadrático - concordam estreitamente entre si e com os pontos de dados. O ajuste quadrático não é tão bom, mas ainda é decente: seu resíduo médio ajustado (para três parâmetros) é de kWh / dia, enquanto o resíduo médio ajustado do modelo da lei de Newton (para quatro parâmetros) é de kWh / dia, cerca de 5% menor. Se tudo o que você deseja fazer é traçar uma curva através dos pontos de dados, a simplicidade e a fidelidade relativa do ajuste quadrático o recomendariam.2.071.97

No entanto, o ajuste quadrático é totalmente inútil para aprender o que está acontecendo! Sua fórmula,

y¯(t¯)=219.956.241t¯+0.04879(t¯)2,

não revela nada de uso diretamente. Com toda a justiça, poderíamos analisar um pouco:

  1. Esta é uma parábola com vértice em graus F. Podemos tomar isso como uma estimativa da temperatura constante da casa. Não difere significativamente de nossa primeira estimativa de graus. No entanto, o custo previsto para esta temperatura é kWh / dia. Isso é o dobro do uso básico de energia, conforme a Lei de Newton.t^0=6.241/(2×0.04879)=64.063.4219.956.241(63.4)+0.04879(63.4)2=20.4

  2. O custo marginal de aquecimento ou resfriamento é obtido a partir do valor absoluto da derivada, . Por exemplo, usando esta fórmula, o custo de aquecimento de uma casa quando a temperatura externa for graus como kWh / dia / grau F. Isso é o dobro do valor estimado com Newton. Lei . 90-6,241+2(0,04879)(90)=2,54y¯(t¯)=6.241+2(0.04879)t¯906.241+2(0.04879)(90)=2.54

    Da mesma forma, o custo para aquecer a casa a uma temperatura externa de graus seria estimado em kWh / dia / grau F. Este é mais do que o dobro do valor estimado com a Lei de Newton.| - 6,241 + 2 ( 0,04879 ) ( 32 ) | = 3,1232|6.241+2(0.04879)(32)|=3.12

    Nas temperaturas médias, o ajuste quadrático erra na outra direção. De fato, em seu vértice na faixa de a graus, ele prevê quase zero custo marginal de aquecimento ou refrigeração, mesmo que essa temperatura média inclua dias tão frios quanto graus e tão quentes quanto graus. (Poucas pessoas que estão lendo este post ainda terão o calor desligado a graus (= graus C)!)68 50 78 50 10606850785010

Em resumo, embora pareça quase tão bom na visualização, o ajuste quadrático erra bastante na estimativa de quantidades fundamentais de interesse relacionadas ao uso de energia. Seu uso para avaliar mudanças no uso é, portanto, problemático e deve ser desencorajado.


Computação

Este Rcódigo executou toda a computação e plotagem. Ele pode ser facilmente adaptado a conjuntos de dados semelhantes.

#
# Read and process the raw data.
#
x <- read.csv("F:/temp/energy.csv")
x$Daily <- x$Usage / x$Length
x <- x[order(x$Temp), ]
#pairs(x)
#
# Fit a quadratic curve.
#
fit.quadratic <- lm(Daily ~ Temp+I(Temp^2), data=x)
# par(mfrow=c(2,2))
# plot(fit.quadratic)
# par(mfrow=c(1,1))
#
# Fit a simple but realistic heating-cooling model with maximum likelihood.
#
response <- function(theta, x, s) {
  alpha <- theta[1]; beta <- theta[2]; gamma <- theta[3]; t.0 <- theta[4]
  x <- x - t.0
  gamma + (beta-alpha)*s^2*dnorm(x, 0, s) +  x*(beta + (alpha-beta)*pnorm(-x, 0, s))
}
log.L <- function(theta, y, x, s) {
  #   theta = (alpha, beta, gamma, t.0, sigma)
  #   x = time
  #   s = estimated SD
  #   y = response
  y.hat <- response(theta, x, s)
  sigma <- theta[5]
  sum((((y - y.hat) / sigma) ^2 + log(2 * pi * sigma^2))/2)
}
theta <- c(alpha=-1, beta=5/4, gamma=20, t.0=65, sigma=2) # Initial guess
x$Spread <- (x$Temp.high - x$Temp.low)/sqrt(6)            # Uniform estimate
fit <- nlm(log.L, theta, y=x$Daily, x=x$Temp, x$Spread)
names(fit$estimate) <- names(theta)
#$
# Set up for plotting.
#
i.pad <- 10
plot(range(x$Temp)+c(-i.pad,i.pad), c(0, max(x$Daily)+20), type="n", 
     xlab="Temp", ylab="Cost, kWh/day",
     main="Data, Model, and Fits")
#
# Plot the data.
#
l <- matrix(mapply(function(l,r,h) {c(l,h,r,h,NA,NA)}, 
                   x$Temp.low, x$Temp.high, x$Daily), 2)
lines(l[1,], l[2,], col="Gray")
points(x$Temp, x$Daily, type="p", pch=3)
#
# Draw the models.
#
x0 <- seq(min(x$Temp)-i.pad, max(x$Temp)+i.pad, length.out=401)
lines(x0, cbind(1, x0, x0^2) %*% coef(fit.quadratic), lwd=3, lty=3)
#curve(response(fit$estimate, x, 0), add=TRUE, lwd=2, lty=1)
t.0 <- fit$estimate["t.0"]
alpha <- fit$estimate["alpha"]
beta <- fit$estimate["beta"]
gamma <- fit$estimate["gamma"]
cool <- "#1020c0"; heat <- "#c02010"
lines(c(t.0, 0), gamma + c(0, -alpha*t.0), lwd=2, lty=1, col=cool)
lines(c(t.0, 100), gamma + c(0, beta*(100-t.0)), lwd=2, lty=1, col=heat)
#
# Display the fit.
#
pred <- response(fit$estimate, x$Temp, x$Spread)
points(x$Temp, pred, pch=16, cex=1, col=ifelse(x$Temp < t.0, cool, heat))
#lines(lowess(x$Temp, pred, f=1/4))
#
# Estimate the residual standard deviations.
#
residuals <- x$Daily - pred
sqrt(sum(residuals^2) / (length(residuals) - 4))
sqrt(sum(resid(fit.quadratic)^2) / (length(residuals) - 3))
whuber
fonte
4
Essa pode ser a melhor resposta para qualquer pergunta de estouro de pilha que eu tenha lido. Aprecio muito o tempo necessário para explicar a lógica e o raciocínio por trás da solução.
Shawn
11
A física é mais cabeluda que isso. O interruptor do condensador e do evaporador atua no aquecimento versus no resfriamento. Isso significa que eles agem como dois sistemas diferentes, não um contínuo. Graus-dia de aquecimento, graus-dia de resfriamento e graus-desumidificação são três fatores de custo separados, e dependendo da localização geográfica (pense em wi, wi, ca, az, mo e fl) e o ano podem agir descontinuamente (o final da estação de aquecimento não é é o mesmo que o início do resfriamento). Estatísticas decentes nos dados dizem que há 5 temporadas, e não 4. Maio é a sua própria temporada, pelo menos nos últimos 5 anos.
precisa saber é o seguinte
@EngrStudent Todos os pontos positivos e muito apreciados. Eu diria que a abordagem apresentada aqui, embora simplificada, mostra o que é necessário para estabelecer uma base para provocar esses efeitos mais sutis. Depois de lidar com os grandes termos do modelo - e acho que ninguém negará que a temperatura deva ser um contribuinte dominante nos custos -, se você tiver feito isso de uma maneira fisicamente significativa, poderá identificar outros termos e talvez até estimar seus efeitos com precisão. Se você não lida corretamente com os grandes termos, não tem esperança de caracterizar os outros.
whuber
Eu amo essa boa base / análise, por favor, ouça isso como aplausos, não como crítica. O processo de aquecimento é diferente do resfriamento, portanto, a quadrática não composta por ambos os lados pode estar em desacordo com isso. A bobina do evaporador fica dentro de casa durante o resfriamento e ao ar livre durante o aquecimento. Na bomba de calor, também há descongelação e ciclagem e "backup de calor". Além disso, o compressor precisa trabalhar mais para lutar contra uma temperatura externa mais extrema, para que você não apenas mova mais calor, como suba uma colina mais alta. Não é linear. A umidade é alta e pode ser 2/3 do orçamento de energia. Infiltração de ar.
EngrStudent
@EngrStudent Obrigado novamente - todos esses são pontos interessantes. Eu não fazia ideia de que a umidade representasse uma proporção tão grande do orçamento. Esse é o tipo de observação que exemplifica o valor potencial de combinar uma boa teoria (ou "modelo conceitual" em alguns círculos) com a análise estatística.
Whuber
0

Recebi uma resposta no StackOverflow . Se alguém tiver pensamentos adicionais, ainda estou muito interessado em soluções alternativas.

/programming/29777890/data-visualization-how-to-represent-kwh-usage-by-year-againstagaa-temperatu

Shawn
fonte
11
A solução em SO é implausível. A lei do resfriamento de Newton , que é uma aproximação razoável de primeira ordem útil como ponto de partida, sugere que o gráfico de uso de energia versus temperatura deve ser a união de duas linhas (talvez de declives diferentes). A média oculta oscilações diárias (e até horárias) de temperatura, que borrarão a região no cruzamento dessas linhas (onde não é necessário aquecimento nem resfriamento). Um ajuste quadrático pode ser razoável lá, mas assintoticamente o ajuste precisa ser linear .
whuber
Eu sei que as médias desfocam a precisão, mas são os dados que tenho. Devido ao pouco entendimento das estatísticas, não consigo entender as frases "deve ser a união de duas linhas ..." e "assintoticamente, o ajuste precisa ser linear" . De um ponto de vista novato, a publicação SO parece intuitiva, pois se encaixa na minha expectativa de que o consumo de energia aumente em extremos opostos da escala de temperatura, sendo o mais baixo na faixa intermediária, onde não era necessário aquecimento nem resfriamento. Um ajuste quadrático não seria simétrico? Não acredito que o uso de energia seja simétrico, pois usamos mais energia para aquecer do que refrigerar. Agradeço quaisquer correções ou conselhos.
Shawn
Um ajuste quadrático, embora simétrico, não é físico nos extremos, porque diz que você pagará muito mais pelo aquecimento nas temperaturas mais baixas e muito mais pelo resfriamento nas temperaturas mais altas do que é fisicamente plausível. Além disso, a simetria na parcela seria esperada apenas quando o custo para resfriar a casa por grau for o mesmo que o custo para aquecê-la por grau, o que pressupõe que os sistemas de aquecimento e resfriamento sejam igualmente eficientes. Isso pode ou não ser o caso - mas você não deve impor essa simetria ao seu modelo.
whuber
Concordo que difere, pois custa mais para esfriar do que calor por grau. No entanto, pelo que entendi o primeiro comentário, você está sugerindo que o ajuste quadrático do post do SO - embora razoável - não seja realmente preciso e que um ajuste linear seja a resposta tecnicamente correta devido à lei do resfriamento de Newton? É a implausibilidade da solução SO que estou deixando de entender.
Shawn
11
Eu não conseguia encaixar minha resposta à última pergunta no espaço para um comentário, então eu a postei como resposta. Não vejo como você infere que os custos de refrigeração por grau são maiores que os custos de aquecimento por grau. Seus dados parecem indicar que o oposto é verdadeiro (embora os custos sejam bem próximos, como seria de esperar). E observe que um modelo linear não implica um ajuste linear ! Há muita coisa acontecendo aqui para fazer com que os dados se desviem sistematicamente desse modelo subjacente.
whuber