Estou tentando entender um artigo sobre previsão de carga elétrica, mas estou lutando com os conceitos internos, especialmente o modelo SARIMAX . Esse modelo é usado para prever a carga e usa muitos conceitos estatísticos que eu não entendo (eu sou um estudante de ciências da computação - você pode me considerar um leigo em estatística). Não é necessário entender completamente como funciona, mas eu gostaria de entender pelo menos intuitivamente o que está acontecendo.
Estou tentando dividir o SARIMAX em pedaços menores e tentando entender cada um deles separadamente e depois juntá-los. Vocês podem me ajudar? Aqui está o que eu tenho até agora.
Comecei com AR e MA.
AR : autorregressivo . Aprendi o que é uma regressão e, pelo meu entendimento, ela simplesmente responde à pergunta: dado um conjunto de valores / pontos, como posso encontrar um modelo que explique esses valores? Portanto, temos, por exemplo, a regressão linear, que tenta encontrar uma linha que possa explicar todos esses pontos. Uma regressão automática é uma regressão que tenta explicar os valores usando seus valores anteriores.
MA : Média Móvel . Na verdade, estou bem perdido aqui. Eu sei o que é uma média móvel, mas o modelo de média móvel não parece ter nada a ver com a média móvel "normal". A fórmula para o modelo parece estranhamente semelhante à AR e não consigo entender nenhum dos conceitos que encontro na internet. Qual é o propósito da MA? Qual é a diferença entre MA e AR?
Então agora temos o ARMA. O eu vem então do Integrated , que, até onde eu entendi, serve simplesmente ao propósito de permitir que o modelo ARMA tenha uma tendência, aumentando ou diminuindo. (Isso equivale a dizer que o ARIMA permite que ele não seja estacionário?)
Agora vem o S da sazonal , que adiciona periodicidade ao ARIMA, que basicamente diz, por exemplo, no caso de previsão de carga, que a carga parece muito semelhante todos os dias às 18h.
Finalmente, o X , a partir de variáveis exógenas , que basicamente permite que variáveis externas sejam consideradas no modelo, como previsões meteorológicas.
Então, finalmente temos o SARIMAX! Minhas explicações estão bem? Reconheça que essas explicações não precisam ser rigorosamente corretas. Alguém pode me explicar o que MA faz intuitivamente?
Respostas:
Como você observou, (1) um modelo AR relaciona o valor de uma observação no tempo com os valores anteriores, com algum erro: Vamos substituir em e, em seguida, : Levando isso para o infinito: Você pode escrever qualquer AR (estacionário) AR ( ) como um MA (x t
Tendo visto isso, vamos reformular nossa definição (1) agora. Um processo de RA relaciona o valor de uma observação no tempo a uma sequência infinita de choques de erro em decomposição de períodos anteriores (que não observamos diretamente).x t ε
Então, o que é um processo de MA pode ser mais claro agora. (2) Um processo MA ( ) relaciona o valor de uma observação no tempo a apenas choques de erro de períodos anteriores (que não observamos diretamente), cujos coeficientes podem variar mais do que o decaimento exponencial implícito em um modelo de RA. Como você observa, isso não tem nada a ver com o conceito usual de "média móvel".x t qq x t q
Com algumas condições nos coeficientes de um processo MA ( ), podemos realmente fazer algo muito semelhante ao que eu mostrei para um processo de RA acima, ou seja, escrever o MA ( ) como um AR ( ). Portanto, é igualmente válido reafirmar (2) dizer que um processo de MA relaciona o valor de uma observação no tempo a uma sequência decadente de todos os valores anteriores de . q q ∞ x t xθ1...θq q q ∞ x t x
Portanto, um modelo ARMA apenas combina essas duas idéias, relacionando a uma sequência de decaimento infinita e a uma sequência definida. O ARIMA apenas adiciona diferenciação ao mix, ou seja, você executa o ARMA em (ou em outras diferenças, como pode ser), para remover a tendência, como você observou.x t - x t - 1xt xt−xt−1
fonte