A análise entre mercados é um método de modelar o comportamento do mercado por meio da busca de relacionamentos entre diferentes mercados. Muitas vezes, uma correlação é calculada entre dois mercados, como o S&P 500 e os títulos do Tesouro dos EUA em 30 anos. Esses cálculos geralmente são baseados em dados de preços, o que é óbvio para todos que não se encaixa na definição de séries temporais estacionárias.
Possíveis soluções à parte (usando retornos), o cálculo da correlação cujos dados são não estacionários é mesmo um cálculo estatístico válido?
Você diria que esse cálculo de correlação não é confiável ou é simplesmente um absurdo?
correlation
stationarity
Milktrader
fonte
fonte
Respostas:
A correlação mede a relação linear. No contexto informal, relacionamento significa algo estável. Quando calculamos a correlação da amostra para variáveis estacionárias e aumentamos o número de pontos de dados disponíveis, essa correlação da amostra tende a uma correlação verdadeira.
Pode-se demonstrar que, para preços, que geralmente são passeios aleatórios, a correlação da amostra tende a variável aleatória. Isso significa que, independentemente da quantidade de dados que temos, o resultado será sempre diferente.
Nota : tentei expressar intuição matemática sem a matemática. Do ponto de vista matemático, a explicação é muito clara: momentos de amostra de processos estacionários convergem em probabilidade para constantes. Momentos de amostra de passeios aleatórios convergem para integrais do movimento browniano, que são variáveis aleatórias. Como o relacionamento geralmente é expresso como um número e não como uma variável aleatória, torna-se evidente o motivo para não calcular a correlação para variáveis não estacionárias.
Atualização Como estamos interessados na correlação entre duas variáveis, assuma primeiro que elas provêm do processo estacionário . A estacionariedade implica que E Z t e c o v ( Z t , Z t - h ) não dependem de t . Então correlaçãoZt=(Xt,Yt) EZt cov(Zt,Zt−h) t
também não depende de , já que todas as quantidades na fórmula vêm da matriz c o v ( Z t ) , que não depende de t . Portanto, o cálculo da correlação da amostrat cov(Zt) t
faz sentido, uma vez que pode ter esperança razoável de que correlação amostra irá estimarρ=corr(Xt,Yt). Acontece que essa esperança não é infundado, uma vez que para processo estacionário satisfazendo certas condições temos quep→
Agora, vamos examinar o que acontece com a correlação da caminhada aleatória do processo não estacionário provavelmente mais estudada. Chamamos o processo uma caminhada aleatória se Z t = ∑ t s = 1 ( U t , V t ) , onde C t = ( U t , V t ) é um processo estacionário. Por simplicidade, assuma que E C t = 0 . EntãoZt=(Xt,Yt) Zt=∑ts=1(Ut,Vt) Ct=(Ut,Vt) ECt=0
Then
So far so good, though the process is not stationary, correlation makes sense, although we had to make same restrictive assumptions.
Now to see what happens to sample correlation we will need to use the following fact about random walks, called functional central limit theorem:
Again for simplicity let us define sample correlation as
Let us start with the variances. We have
This goes to infinity asT increases, so we hit the first problem, sample variance does not converge. On the other hand continuous mapping theorem in conjunction with functional central limit theorem gives us
Similarly we get
So finally for sample correlation of our random walk we get
So although correlation is well defined, sample correlation does not converge towards it, as in stationary process case. Instead it converges to a certain random variable.
fonte
LetW be a discrete random walk. Pick a positive number h . Define the processes P and V by P(0)=1 , P(t+1)=−P(t) if V(t)>h , and otherwise P(t+1)=P(t) ; and V(t)=P(t)W(t) . In other words, V starts out identical to W but every time V rises above h , it switches signs (otherwise emulating W in all respects).
(In this figure (forh=5 ) W is blue and V is red. There are four switches in sign.)
In effect, over short periods of timeV tends to be either perfectly correlated with W or perfectly anticorrelated with it; however, using a correlation function to describe the relationship between V and W wouldn't be useful (a word that perhaps more aptly captures the problem than "unreliable" or "nonsense").
Mathematica code to produce the figure:
fonte