Estou interessado na relação entre duas variáveis de série temporal: e . As duas variáveis estão relacionadas entre si, e não está claro pela teoria qual delas causa a outra.
Dado isso, não têm boas razões para preferir a regressão linear sobre .
Claramente, existe alguma relação entre e , embora eu me lembre de estatísticas suficientes para entender que não é verdadeiro. Ou talvez nem esteja perto? Estou um pouco enevoado.
O problema é decidir o quanto de deve-se manter contra .
Estou pensando em pegar a média de e e usá-la como a taxa de hedge.
A média de e um conceito significativo?
E como uma questão secundária (talvez essa deva ser outra publicação), qual é a maneira apropriada de lidar com o fato de que as duas variáveis estão relacionadas entre si - o que significa que realmente não existe uma variável independente e dependente?
fonte
Respostas:
Para ver a conexão entre as duas representações, escolha um vetor Normal bivariado: com os condicionais e Isso significa que(X1 1X2) ∼ N( (μ1 1μ2) , (σ21 1ρσ1 1σ2ρσ1 1σ2σ22) ) X1 1∣X2=x2∼ N(μ1 1+ ρσ1 1σ2(x2-μ2) , ( 1 -ρ2)σ21 1) X2∣X1 1=x1 1∼ N(μ2+ ρσ2σ1 1(x1 1-μ1 1) , ( 1 -ρ2)σ22) X1 1=(μ1 1- ρσ1 1σ2μ2)α+ρσ1 1σ2βX2+1 -ρ2-----√σ1 1ϵ1 1
e
que significa que (a) não é e (b) a conexão entre as duas regressões depende da distribuição conjunta de .X2=(μ2- ρσ2σ1 1μ1 1)κ+ρσ2σ1 1γX1 1+1 -ρ2-----√σ2ϵ2 γ 1 / β (X1 1,X2)
fonte
Convertido de um comentário .....
Os valores exatos de e podem ser encontrados nesta resposta para Efeito de alternar respostas e variáveis explicativas em regressão linear simples e, como você suspeita, não é o recíproco de e a média de e (ou a média de e ) não é o caminho certo a seguir. Uma visão pictórica do que e estão minimizando é dada na resposta de Elvisβ γ β γ β γ β 1 / γ β γ para a mesma pergunta e na resposta, ele introduz uma regressão de "menos retângulos" que pode ser o que você está procurando. Os comentários após a resposta de Elvis não devem ser negligenciados; eles relacionam essa regressão de "mínimos retângulos" a outras técnicas estudadas anteriormente. Em particular, observe que o moderador chl indica que esse método é interessante quando não está claro qual é a variável preditora e qual a variável de resposta.
fonte
Como Xi'an observou em sua resposta, oβ e γ estão relacionados entre si por meio dos meios condicionais X| Y e Y| X (que por sua vez se relacionam com uma única distribuição conjunta), elas não são simétricas no sentido de queβ≠ 1 / γ . Este não é o caso se você 'conhecer' a verdadeiraσ e ρ em vez de usar estimativas. Você temβ=ρXYσYσX e γ=ρXYσXσY
ou você poderia dizer
Veja também regressão linear simples na wikipedia para o cálculo daβ e γ .
É esse termo de correlação que meio que perturba a simetria. Quando oβ e γ seria simplesmente a razão do desvio padrão σY/σX e σX/σY então eles seriam, de fato, inversos. oρXY pode-se considerar que o termo modifica isso como uma espécie de regressão à média .
Uma linha de regressão é o método certo?
Você pode se perguntar se essas probabilidades condicionais e linhas de regressão são o que você precisa para determinar suas proporções deX e Y . Não está claro para mim como você deseja usar uma linha de regressão no cálculo de uma proporção ideal.
Abaixo está uma maneira alternativa de calcular a proporção. Este método possui simetria (ou seja, se você alternar X e Y, obterá a mesma proporção).
Alternativa
Digamos, os rendimentos dos títulosX e Y são distribuídos de acordo com uma distribuição normal multivariada† com correlação ρXY e desvios-padrão σX e σY então o rendimento de uma cobertura que é a soma de X e Y será distribuído normalmente:
estavam0≤α≤1 e com
O máximo da médiaμH estará em α=0 or α=1 ou não existe quando μX=μY .
O mínimo da variaçãoσ2H estará em α=1−σ2X−ρXYσXσYσ2X+σ2Y−2ρXYσXσY=σ2Y−ρXYσXσYσ2X+σ2Y−2ρXYσXσY
O ideal estará em algum lugar entre esses dois extremos e depende de como você deseja comparar perdas e ganhos
Observe que agora existe uma simetria entreα e 1−α . Não importa se você usa o hedgeH=α1X+(1−α1)Y ou a cobertura H=α2Y+(1−α2)X . Você obterá as mesmas proporções em termos deα1= 1 -α2 .
Caso de variação mínima e relação com os componentes principais
No caso de variação mínima (aqui, na verdade, você não precisa assumir uma distribuição normal multivariada), obtém a seguinte taxa de hedge como idealα1 - α=v a r ( Y) - c o v ( X, Y)v a r ( X) - c o v ( X, Y) que pode ser expresso em termos dos coeficientes de regressão β= c o v ( X, Y) / v a r ( X) e γ= c o v ( X, Y) / v a r ( Y) e é o seguinte α1 - α=1 - β1 - γ
Em uma situação com mais de duas variáveis / ações / títulos, você pode generalizar isso para o último componente do princípio (menor valor próprio).
Variantes
Melhorias no modelo podem ser feitas usando distribuições diferentes das normais multivariadas. Também é possível incorporar o tempo em um modelo mais sofisticado para fazer melhores previsões de valores / distribuições futuras para o parX, Y .
fonte
Talvez a abordagem da "causalidade de Granger" possa ajudar. Isso ajudaria você a avaliar se X é um bom preditor de Y ou se X é melhor de Y. Em outras palavras, informa se beta ou gama é a coisa a ser levada mais a sério. Além disso, considerando que você está lidando com dados de séries temporais, ele informa quanto do histórico de X conta para a previsão de Y (ou vice-versa).
A Wikipedia dá uma explicação simples: uma série temporal X é atribuída à causa Granger Y, se puder ser mostrada, geralmente através de uma série de testes t e testes F nos valores atrasados de X (e com valores atrasados de Y também incluídos) , que esses valores X fornecem informações estatisticamente significativas sobre valores futuros de Y.
O que você faz é o seguinte:
Continue por qualquer extensão do histórico que seja razoável. Verifique a significância das estatísticas F para cada regressão. Em seguida, faça o mesmo no sentido inverso (portanto, agora regride os valores passados de X e Y em X (t)) e veja quais regressões têm valores F significativos.
Um exemplo muito simples, com código R, é encontrado aqui . A causalidade de Granger foi criticada por não estabelecer a causalidade (em alguns casos). Mas parece que sua aplicação é realmente sobre "causalidade preditiva", que é exatamente para o que a abordagem de causalidade de Granger se destina.
O ponto é que a abordagem dirá se X prediz Y ou se Y prediz X (para que você não seja mais tentado a artificial e incorretamente - compor os dois coeficientes de regressão) e fornece uma previsão melhor (como você saberá quanto histórico de X e Y você precisa saber para prever Y), o que é útil para fins de hedge, certo?
fonte