A econometria de uma abordagem bayesiana da metodologia de estudo de eventos

11

Os estudos de eventos são difundidos em economia e finanças para determinar o efeito de um evento no preço das ações, mas quase sempre são baseados no raciocínio freqüentista. Uma regressão OLS - durante um período de referência distinto da janela de eventos - é geralmente usada para determinar os parâmetros necessários para modelar o retorno normal de um ativo. Em seguida, determina-se a significância estatística dos retornos anormais cumulativos ( ) no ativo i após um evento durante uma janela de evento especificada deCARi a t 2 . Um teste de hipótese é usado para determinar se esses retornos são significativos e, portanto, de fato anormais ou não. Portanto:T1T2

, ondeH0:CARi=0

eCARi=t=T1T2ARi,t=t=T1T2(ri,tE[ri,t])

é o retorno sobre o activo previsto pelo modelo.E[ri,t]

Se nosso número de observações for grande o suficiente, podemos assumir a normalidade assintótica da distribuição dos retornos dos ativos, mas isso pode não ser verificado para um tamanho amostral menor.

Pode-se argumentar que, por causa disso, os estudos de empresa única e de evento único (como exigido, por exemplo, em litígios) devem seguir uma abordagem bayesiana, porque a suposição de infinitas repetições está muito "longe de ser verificada" do que no caso de várias empresas. No entanto, a abordagem freqüentista continua sendo uma prática comum.

Dada a escassa literatura sobre esse assunto, minha pergunta é como melhor abordar um estudo de evento - análogo à metodologia descrita acima e resumida em MacKinlay, 1997 - usando uma abordagem bayesiana.

Embora essa questão surja no contexto das finanças corporativas empíricas, trata-se realmente da econometria da regressão e inferência bayesiana e das diferenças de raciocínio por trás das abordagens freqüentista e bayesiana. Especificamente:

  1. Como devo abordar da melhor maneira a estimativa dos parâmetros do modelo usando uma abordagem bayesiana (assumindo uma compreensão teórica da estatística bayesiana, mas pouca ou nenhuma experiência em usá-lo para pesquisas empíricas).

  2. Como faço para testar a significância estatística, depois que os retornos anormais cumulativos foram calculados (usando os retornos normais do modelo)?

  3. Como isso pode ser implementado no Matlab?

Constantin
fonte
1
(1.) é simples: use regressão linear bayesiana . (2.) é mais complicado, porque o teste de significância não é coisa bayesiana. A única coisa que você pode fazer é comparar a probabilidade de modelos diferentes, e não é a base de um modelo porque o CAR não é um parâmetro do modelo. Qual é o objetivo do CAR ? Que decisões são tomadas com base nisso? CAR=0CARCAR
Andy Jones
Eu estou procurando evidências em apoio da minha suposição de que o evento examinado tem uma influência sobre o preço das ações (caso em que o é diferente de zero, porque ele é calculado durante a janela de evento, em relação ao retorno normal, que é calculado para o período de referência antes do evento). Estou interessado em saber se os dados apoiam a hipótese de que existe de fato um diferente de zero C A R e também em sua magnitude. Eu percebo que a significância estatística não é realmente uma coisa nas estatísticas bayesianas, mas que interpretação esse método oferece? Posso aplicar um equivalente de teste de hipótese? CARCAR
Constantin
2
Se você quiser argumentar que a abordagem bayesiana é mais aplicável a pequenas amostras de tamanho , é inevitável que o anterior fale muito alto com essa amostra. n=1
StasK
Não posso usar um anterior não informativo?
Constantin

Respostas:

5

Conforme mencionado nos comentários, o modelo que você está procurando é regressão linear bayesiana . E como podemos usar o BLR para calcular a distribuição preditiva posterior para qualquer momento tp(rt|t,Dref)t , podemos avaliar numericamente a distribuição .p(CAR|Devent,Dref)

O problema é que não acho que uma distribuição pelo seja o que você realmente deseja. O problema imediato é que p ( CAR = 0 | D evento , D ref ) tem probabilidade zero. O problema subjacente é que a "versão bayesiana dos testes de hipóteses" está comparando modelos pelo fator Bayes , mas isso exige que você defina dois modelos concorrentes. E CAR = 0 , CAR 0CARp(CAR=0|Devent,Dref)CAR=0,CAR0 não são modelos (ou pelo menos, não são modelos sem algum malabarismo numérico extremamente artificial).

Pelo que você disse nos comentários, acho que o que você realmente quer responder é

São eventos e DDrefDevent melhor explicados pelo mesmo modelo ou por diferentes?

que tem uma resposta bayesiana pura: defina dois modelos

  • : todos os dados no evento D ref , D são retirados do mesmo BLR. Para calcular a probabilidade marginal p ( D ref , D evento | M 0 ) desse modelo, você calcularia a probabilidade marginal de um BLR ajustado a todos os dados.M0Dref,Deventp(Dref,Devent|M0)

  • : os dados nos eventos D ref e D são obtidos de dois BLRs diferentes. Para calcular a probabilidade marginal p ( D ref , D evento | M 1 )M1DrefDeventp(Dref,Devent|M1) deste modelo, você iria caber BLRs a e D eventoDrefDevent de forma independente, em seguida, tomar o produto dos dois BLR marginal (embora usando as mesmas hiperparâmetros!) probabilidades.

Feito isso, você pode calcular o fator Bayes

p(Dref,Devent|M1)p(Dref,Devent|M0)

decidir qual modelo é mais crível.

Andy Jones
fonte
Não acho que um modelo separado para o período do evento seja diretamente aplicável à minha pergunta de pesquisa específica, porque não há outro fator de risco que eu possa adicionar para explicar o retorno durante a janela do evento. Estou vendo o evento como uma perturbação em relação ao retorno normal do meu modelo de precificação de ativos, portanto, comparar dois modelos não é realmente viável. Não é possível construir um intervalo de confiança para ? Dessa forma, eu poderia examinar se 0 está dentro de um certo intervalo sobre a estimativa de ML, não? CAR
Constantin
A variante bayesiana de intervalos de confiança é um intervalo credível , e sim, você pode usar a distribuição para construir um. Mas esse não é um teste de hipótese. CAR
Andy Jones
1
Eu acho que poderia ter explicado mal o mesmo modelo / coisa de modelos diferentes - acima, o que eu quis dizer com "modelo diferente" era "parâmetros diferentes". Em , um conjunto de parâmetros é usado para explicar todos os dados. Em M 1 , um conjunto de parâmetros é usado para explicar os dados de treinamento e outro para explicar os dados de teste. Essa é uma comparação justa porque, embora M 1 tenha o dobro de parâmetros que pode caber nos dados (aumentando sua probabilidade marignal), ele extrai o dobro de parâmetros do anterior (que penaliza sua probabilidade marginal). M0M1M1
Andy Jones
Ok, eu entendi o conceito. Isso parece elegante de fato. Como exatamente eu especificaria os dois modelos? Você poderia recomendar literatura ou conceitos relacionados para estudar especificamente?
Constantin
1
Embora seja controverso, existe um teste de hipótese nula ou nítida de ponto bayesiano. É apenas a simples razão de chances com um anterior descontínuo no . Isso é controverso porque a maioria dos modelos não fornece uma boa justificativa para uma mistura de prévios contínuos e discretos. Os estudos de eventos são uma possível exceção a essa regra. CARi=0
Jayk
2

Você não pode fazer um estudo de evento com uma única empresa.

Infelizmente, você precisa de dados em painel para qualquer estudo de evento. Os estudos de eventos concentram-se nos retornos de períodos individuais antes e depois dos eventos. Sem várias observações firmes por período de tempo antes e depois do evento, é impossível distinguir o ruído (variação específica da empresa) dos efeitos do evento. Mesmo com apenas algumas empresas, o ruído vai dominar o evento, como StasK aponta.

Dito isto, com um painel de muitas empresas, você ainda pode fazer um trabalho bayesiano.

Como estimar retornos normais e anormais

Vou assumir que o modelo que você usa para retornos normais se parece com um modelo de arbitragem padrão. Caso contrário, você poderá adaptar o restante desta discussão. Você deseja aumentar sua regressão de retorno "normal" com uma série de manequins para a data relativa à data do anúncio, S :

rit=αi+γtS+rm,tTβi+eit

EDIT: Deve ser que seja incluído apenas se s > 0 . Um problema com este problema com esta abordagem é que β i será informado por dados antes e após o evento. Isso não é mapeado com precisão para estudos tradicionais de eventos, onde os retornos esperados são calculados apenas antes do evento.γss>0βi

Essa regressão permite que você fale sobre algo semelhante ao tipo de série CAR que normalmente vemos, onde temos um gráfico de retornos anormais médios antes e depois de um evento com talvez alguns erros padrão:

insira a descrição da imagem aqui

( descaradamente retirado da Wikipedia )

Você vai precisar para chegar a uma estrutura de erro distribuição e para o 's, provavelmente distribuídos normalmente, com alguma estrutura de variância-co-variância. Em seguida, você pode configurar uma distribuição anterior para α i , β i e γ seitαiβiγs e executar Bayesiana regressão linear, como foi mencionado acima.

Examinando os efeitos do anúncio

γ00γ0=0 pode exigir conhecimento muito mais específico do que temos à nossa disposição (veja abaixo).

γ0 . Isso permite que você responda de algumas maneiras perguntas mais interessantes como "Qual a probabilidade de os retornos excedentes do anúncio serem negativos?" Portanto, para retornos anormais na data do anúncio, sugiro abandonar os testes estritos de hipóteses. De qualquer forma, você não está interessado neles - com a maioria dos estudos de eventos, você realmente quer saber qual pode ser a reação do preço a um anúncio, e não o que não é!

γ00γ0γ0γ0

No entanto, para datas anteriores e posteriores ao anúncio, o teste rigoroso de hipóteses pode desempenhar um papel importante, porque esses retornos podem ser vistos como testes de eficiência de forma forte e semi-forte

Teste de violações da eficiência da forma semi-forte

γs>0=0

γs=0x¯fX={xi}i=1n $60,000 você usaria um fator Bayes:

P(x¯=$60,000|X)=x¯=$60,000P(X)f(x¯)x¯$60,000P(X)f(x¯)

P(x¯=$60,000|X)=0

γs>0=0γs>0γs>0=0pγs0=01pγs>0f

P(γs>0=0|data)=P(data|γs>0=0)pγs>00P(data|γs>0)(1p)f(γs>0)>0

γs>0=0

γs>0γs=0γs>0γs=0) para comparar com retornos reais, como uma ponte entre os métodos bayesiano e freqüentista.

Retornos anormais cumulativos

Até agora, tudo foi uma discussão sobre retornos anormais. Então, eu vou entrar rapidamente no CAR:

CARτ=t=0τγt

γ0=0CARt>0=0

Como implementar no Matlab

Para uma versão simples desses modelos, você só precisa de regressão linear bayesiana antiga e regular. Eu não uso o Matlab, mas parece que há uma versão aqui . É provável que isso funcione apenas com anteriores conjugados.

Para versões mais complicadas, por exemplo, o teste de hipóteses, você provavelmente precisará de um amostrador de Gibbs. Não conheço nenhuma solução pronta para uso do Matlab. Você pode verificar interfaces para JAGS ou BUGS.

jayk
fonte
n1
O efeito de uma legislação específica pode ser impossível de encontrar. Se for uma lei aplicada a (digamos) um setor específico, será difícil separar as tendências do setor da legislação. Definitivamente, sugeriria mais de 30 empresas, se possível. Você sempre pode verificar se o anterior e o posterior são muito diferentes. Se o seu posterior não mudou muito em relação ao seu anterior, é provável que o tamanho da amostra seja muito pequeno.
Jayk
Você me deu uma referência para um estudo de evento que usa variáveis ​​fictícias para datas pré / pós-evento? Ainda não consegui encontrar essa metodologia na literatura. Eu agradeceria muito!
Constantin
Eu não vi nenhum, mas acho que o método faz sentido no contexto (com as ressalvas que coloquei nele). Uma alternativa seria estimar seus parâmetros nas datas de pré-anúncio e, em seguida, usar o posterior para gerar os retornos daqui para frente, como no artigo de Brav que mencionei acima.
jayk