A média de betas de Y ~ X e X ~ Y é válida?

7

Estou interessado na relação entre duas variáveis de série temporal: e . As duas variáveis ​​estão relacionadas entre si, e não está claro pela teoria qual delas causa a outra. YX

Dado isso, não têm boas razões para preferir a regressão linear Y=α+βX sobre X=κ+γY .

Claramente, existe alguma relação entre β e γ , embora eu me lembre de estatísticas suficientes para entender que β=1 1/γ não é verdadeiro. Ou talvez nem esteja perto? Estou um pouco enevoado.

O problema é decidir o quanto de X deve-se manter contra Y .

Estou pensando em pegar a média de β e 1 1/γ e usá-la como a taxa de hedge.

A média de β e 1 1/γ um conceito significativo?

E como uma questão secundária (talvez essa deva ser outra publicação), qual é a maneira apropriada de lidar com o fato de que as duas variáveis ​​estão relacionadas entre si - o que significa que realmente não existe uma variável independente e dependente?

Ricardo
fonte
11
O problema não é causalidade, mas os erros de medição (geralmente é a variável dependente Y que possui um grande erro de medição, tornando "Y = a + B x + error" a expressão comum). Você tem uma idéia sobre os erros na medição de X e Y.
Sextus Empiricus
11
Os valores exatos de e podem ser encontrados nesta resposta para Efeito de alternar respostas e variáveis ​​explicativas ... e, como você suspeita, não é o recíproco de , e calcula a média de e não é o caminho certo a seguir. Uma visão pictórica do que e estão minimizando é dada na resposta de Elvis à mesma pergunta, e ele introduz uma regressão de "menos retângulos" que você pode querer .....βγβγβ1 1/γβγ
Dilip Sarwate
3
Você está no cenário ideal em que a escolha da técnica tem um impacto direto, fisicamente mensurável; você pode simplesmente medir o erro de cobertura fora da amostra para cada estimativa e compará-los. Além disso, o hedge tipicamente ideal é melhor tratado com o uso de um modelo VECM (consulte, por exemplo, Gatarek e Johansen, 2014, Hedge ideal com o modelo autoregressivo vetorial cointegrado ), que não requer a escolha do modelo Y em função de X ou vice-versa .
22419 Chris Haug
11
Você pode considerar a média geométrica como uma possibilidade (se ambas forem negativas, você poderá obter a raiz quadrada negativa). Então veja , que deve ser muito parecido com o #βγsysx
Henry Henry
11
@ricardo Observe que eu especifiquei erro fora da amostra , portanto não o ajuste (dentro da amostra) do modelo. E é perfeitamente possível que a taxa ideal de hedge mude ao longo do tempo (especialmente se o relacionamento não for realmente linear), isso não muda o fato de que descobrir a melhor estratégia de hedge pode ser feito mais diretamente testando o modelo novamente e observando os resultados.
Chris Haug

Respostas:

11

Para ver a conexão entre as duas representações, escolha um vetor Normal bivariado: com os condicionais e Isso significa que

(X1 1X2)N((μ1 1μ2),(σ1 12ρσ1 1σ2ρσ1 1σ2σ22))
X1 1X2=x2N(μ1 1+ρσ1 1σ2(x2-μ2),(1 1-ρ2)σ1 12)
X2X1 1=x1 1N(μ2+ρσ2σ1 1(x1 1-μ1 1),(1 1-ρ2)σ22)
X1 1=(μ1 1-ρσ1 1σ2μ2)α+ρσ1 1σ2βX2+1 1-ρ2σ1 1ϵ1 1
e que significa que (a) não é e (b) a conexão entre as duas regressões depende da distribuição conjunta de .
X2=(μ2-ρσ2σ1 1μ1 1)κ+ρσ2σ1 1γX1 1+1 1-ρ2σ2ϵ2
γ1 1/β(X1 1,X2)

Xi'an
fonte
Como eu decidiria se a média dos dois betas é uma medida melhor do hedge ratio do que um ou outro?
ricardo
4
Eu não faço ideia.
Xian
@ricardo Medindo o erro de cobertura fora da amostra em cada estimativa, que é o que você está tentando minimizar.
Chris Haug
3

Convertido de um comentário .....

Os valores exatos de e podem ser encontrados nesta resposta para Efeito de alternar respostas e variáveis ​​explicativas em regressão linear simples e, como você suspeita, não é o recíproco de e a média de e (ou a média de e ) não é o caminho certo a seguir. Uma visão pictórica do que e estão minimizando é dada na resposta de Elvisβγβγβγβ1 1/γβγpara a mesma pergunta e na resposta, ele introduz uma regressão de "menos retângulos" que pode ser o que você está procurando. Os comentários após a resposta de Elvis não devem ser negligenciados; eles relacionam essa regressão de "mínimos retângulos" a outras técnicas estudadas anteriormente. Em particular, observe que o moderador chl indica que esse método é interessante quando não está claro qual é a variável preditora e qual a variável de resposta.

Dilip Sarwate
fonte
3

β e γ

Como Xi'an observou em sua resposta, o β e γ estão relacionados entre si por meio dos meios condicionais X|Y e Y|X(que por sua vez se relacionam com uma única distribuição conjunta), elas não são simétricas no sentido de queβ1 1/γ. Este não é o caso se você 'conhecer' a verdadeiraσ e ρem vez de usar estimativas. Você tem

β=ρXYσYσX
e
γ=ρXYσXσY

ou você poderia dizer

βγ=ρXY21 1

Veja também regressão linear simples na wikipedia para o cálculo daβ e γ.

É esse termo de correlação que meio que perturba a simetria. Quando oβ e γ seria simplesmente a razão do desvio padrão σY/σX e σX/σYentão eles seriam, de fato, inversos. oρXYpode-se considerar que o termo modifica isso como uma espécie de regressão à média .

  • Com correlação perfeita ρXY=1 1 então você pode prever completamente X baseado em You vice-versa. As encostas serão iguais
    βγ=1 1
  • Mas com uma correlação menos que perfeita, ρXY<1 1, você não pode fazer essas previsões perfeitas e a média condicional estará um pouco mais próxima da média incondicional, em comparação com uma escala simples de σY/σX ou σX/σY. As inclinações das linhas de regressão serão menos íngremes. As encostas não serão relacionadas, pois são recíprocas e seu produto será menor que um
    βγ<1 1

Uma linha de regressão é o método certo?

Você pode se perguntar se essas probabilidades condicionais e linhas de regressão são o que você precisa para determinar suas proporções de X e Y. Não está claro para mim como você deseja usar uma linha de regressão no cálculo de uma proporção ideal.

Abaixo está uma maneira alternativa de calcular a proporção. Este método possui simetria (ou seja, se você alternar X e Y, obterá a mesma proporção).


Alternativa

Digamos, os rendimentos dos títulos X e Y são distribuídos de acordo com uma distribuição normal multivariada com correlação ρXY e desvios-padrão σX e σY então o rendimento de uma cobertura que é a soma de X e Y será distribuído normalmente:

H=αX+(1α)YN(μH,σH2)

estavam 0α1 e com

μH=αμX+(1α)μYσH2=α2σX2+(1α)2σY2+2α(1α)ρXYσXσY=α2(σX2+σY22ρXYσXσY)+α(2σY2+2ρXYσXσY)+σY2

O máximo da média μH estará em

α=0 or α=1
ou não existe quando μX=μY.

O mínimo da variação σH2 estará em

α=1σX2ρXYσXσYσX2+σY22ρXYσXσY=σY2ρXYσXσYσX2+σY22ρXYσXσY

O ideal estará em algum lugar entre esses dois extremos e depende de como você deseja comparar perdas e ganhos

Observe que agora existe uma simetria entre α e 1α. Não importa se você usa o hedgeH=α1X+(1α1)Y ou a cobertura H=α2Y+(1α2)X. Você obterá as mesmas proporções em termos deα1 1=1 1-α2.

Caso de variação mínima e relação com os componentes principais

No caso de variação mínima (aqui, na verdade, você não precisa assumir uma distribuição normal multivariada), obtém a seguinte taxa de hedge como ideal

α1 1-α=vumar(Y)-cov(X,Y)vumar(X)-cov(X,Y)
que pode ser expresso em termos dos coeficientes de regressão β=cov(X,Y)/vumar(X) e γ=cov(X,Y)/vumar(Y) e é o seguinte
α1 1-α=1 1-β1 1-γ

Em uma situação com mais de duas variáveis ​​/ ações / títulos, você pode generalizar isso para o último componente do princípio (menor valor próprio).


Variantes

Melhorias no modelo podem ser feitas usando distribuições diferentes das normais multivariadas. Também é possível incorporar o tempo em um modelo mais sofisticado para fazer melhores previsões de valores / distribuições futuras para o parX,Y.


Isso é uma simplificação, mas serve para o propósito de explicar como alguém pode e deve executar a análise para encontrar uma proporção ideal sem uma linha de regressão.

Sextus Empiricus
fonte
11
Sinto muito, mas como físico, sei muito pouco sobre o idioma (longo, curto, participações etc.) relacionado a ações, títulos e finanças. Se você pudesse transmiti-lo em linguagem mais simples, talvez eu entendesse e trabalhasse com ele. Minha resposta é apenas uma expressão muito simples que desconhece os detalhes e as possibilidades de como expressar hedge e ações, mas mostra o princípio básico de como você pode se livrar do uso de uma linha de regressão (volte aos primeiros princípios, expresse a modelo de lucro que está no centro em vez de usar linhas de regressão cuja relevância não é diretamente clara).
Sextus Empiricus
Eu acho que entendi. O problema é que 1 / ρ_ {XY} \ ne p_ {XY}.Eundeed,p_ {XY} $ frequentemente muda bastante quando tomamos o inverso. Sua alternativa está próxima do caso em que estou pensando, mas quero verificar uma coisa: isso permite participações não-negativas? Adotando sua terminologia, eu teria uma unidade de retenção da ligação X e uma retenção negativa de Y. Diga uma unidade longa da ligação X e curta (digamos) 1,2 unidades da ligação Y ... mas poderia ser 0,2 unidades ou 5 unidades, dependendo da matemática.
ricardo
long significa que eu ganho 1% em um título se o preço aumentar em ~ 1%; short significa que eu perco ~ 1% em um título se o preço aumentar em ~ 1%. Portanto, a ideia é que eu tenha uma unidade de um vínculo (por isso me beneficio de uma apreciação) e tenha uma certa quantia do outro vínculo (por isso perco uma apreciação).
ricardo
"O problema é decidir quanto de X se deve manter contra Y." Meu problema com isso é que não há explicação / modelo / expressão sobre como você decide sobre isso. Como você define perdas e ganhos e quanto os valoriza?
Sextus Empiricus
Existem custos associados a ser curto e longo? Eu imagino que você tenha um determinado valor para investir e isso limita o quanto você pode ser curto / longo nesses títulos. Com base no seu conhecimento anterior, você pode estimar / determinar a distribuição de perdas / ganhos para qualquer combinação nesse limite. Por fim, com base em alguma função que determina como você valoriza perdas e ganhos (isso expressa por que / como você protege), você pode decidir qual combinação escolher.
Sextus Empiricus
1

Talvez a abordagem da "causalidade de Granger" possa ajudar. Isso ajudaria você a avaliar se X é um bom preditor de Y ou se X é melhor de Y. Em outras palavras, informa se beta ou gama é a coisa a ser levada mais a sério. Além disso, considerando que você está lidando com dados de séries temporais, ele informa quanto do histórico de X conta para a previsão de Y (ou vice-versa).

A Wikipedia dá uma explicação simples: uma série temporal X é atribuída à causa Granger Y, se puder ser mostrada, geralmente através de uma série de testes t e testes F nos valores atrasados ​​de X (e com valores atrasados ​​de Y também incluídos) , que esses valores X fornecem informações estatisticamente significativas sobre valores futuros de Y.

O que você faz é o seguinte:

  • regredir X (t-1) e Y (t-1) em Y (t)
  • regressão X (t-1), X (t-2), Y (t-1), Y (t-2) em Y (t)
  • regressão X (t-1), X (t-2), X (t-3), Y (t-1), Y (t-2), Y (t-3) em Y (t)

Continue por qualquer extensão do histórico que seja razoável. Verifique a significância das estatísticas F para cada regressão. Em seguida, faça o mesmo no sentido inverso (portanto, agora regride os valores passados ​​de X e Y em X (t)) e veja quais regressões têm valores F significativos.

Um exemplo muito simples, com código R, é encontrado aqui . A causalidade de Granger foi criticada por não estabelecer a causalidade (em alguns casos). Mas parece que sua aplicação é realmente sobre "causalidade preditiva", que é exatamente para o que a abordagem de causalidade de Granger se destina.

O ponto é que a abordagem dirá se X prediz Y ou se Y prediz X (para que você não seja mais tentado a artificial e incorretamente - compor os dois coeficientes de regressão) e fornece uma previsão melhor (como você saberá quanto histórico de X e Y você precisa saber para prever Y), o que é útil para fins de hedge, certo?

Steve G. Jones
fonte
Eu tenho uma forte razão teórica para acreditar que nenhuma delas é realmente uma causa, e que mesmo que alguém se torne uma causa, isso não permanecerá verdadeiro com o tempo. Portanto, não acho que Granger Causailty seja a resposta neste caso. Eu votei a resposta em qualquer caso, pois é útil - esp. o código R.
ricardo
É por isso que mencionei explicitamente que "a causalidade de Granger foi criticada por não estabelecer a causalidade (em alguns casos)". Parece-me que sua pergunta é mais sobre o estabelecimento de "causalidade preditiva", que é a finalidade da causalidade de Granger. Além disso, a abordagem da Granger usa as informações dos dados de séries temporais, que são um desperdício que você não deve usar se os tiver. Obviamente, você pode (deveria?) Reestimar os efeitos ao longo do tempo. Espero que os efeitos de Granger sejam mais estáveis ​​que os OLS de seção transversal (você pode testar isso com antecedência, usando dados históricos). HTH
Steve G. Jones