Diferença entre distribuição normal padrão multivariada e cópula gaussiana

17

Eu me pergunto qual é a diferença entre a distribuição normal padrão multivariada e a cópula gaussiana, pois, quando olho para a função de densidade, elas parecem iguais para mim.

Minha questão é por que a cópula gaussiana é introduzida ou que benefício a cópula gaussiana gera ou qual é sua superioridade quando a cópula gaussiana não passa de uma função normal padrão multivariada.

Além disso, qual é o conceito por trás da transformação integral de probabilidade em cópula? Quero dizer, sabemos que uma cópula é uma função com variável uniforme. Por que tem que ser uniforme? Por que não usar os dados reais como distribuição normal multivariada e encontrar a matriz de correlação? (Normalmente, plotamos os dois retornos de ativos para considerar seus relacionamentos, mas quando é cópula, plotamos os EUA, que são probabilidades.)

Outra pergunta. Também duvido que a matriz de correlação do MVN possa ser não paramétrica ou semi-paramétrica como a da cópula (pois o parâmetro copula pode ser a tau de Kendall, etc.)

Ficaria muito grato por sua ajuda, pois sou novo nesta área. (mas eu li muitos artigos e essas são as únicas coisas que eu não entendo)

user26979
fonte
Como você está "olhando para a função densidade"? Você pode não estar usando um método sensível o suficiente. Por exemplo, a densidade certamente não é multivariada normal quando os marginais não são normais! Tentar fazer isso usando uma cópula Gaussian com uma multimodal de distribuição, tais como Beta : que deve olhar decididamente não-normal! (1/2,1/2)
whuber
a equação (6) é a cúpula gaussiana bivariada CDF iopscience.iop.org/2041-8205/708/1/L9/fulltext/… enquanto a primeira seção da descrição da equação é a CDF normal bivariada roguewave.com/portals/0/products/ imsl-numerical-libraries /… e quando as comparamos, a forma funcional é muito semelhante. bem, eles são exatamente iguais para mim.
user26979
Você está certo: é por isso que você não deve confiar em referências aleatórias da Internet, especialmente aquelas com termos mal definidos e com uma digitação horrível. Consulte Nelson (uma das fontes para o seu primeiro link e eminentemente legível).
whuber
1
então, para não mencionar o exposto acima, qual é a diferença em sua opinião?
user26979

Respostas:

20

Uma regra geral sobre documentos técnicos - especialmente os encontrados na Web - é que a confiabilidade de qualquer definição estatística ou matemática oferecida neles varia inversamente com o número de assuntos não estatísticos não relacionados mencionados no título do artigo. O título da página na primeira referência oferecida (em um comentário à pergunta) é "Das finanças à cosmologia: a cópula da estrutura em larga escala". Com "finanças" e "cosmologia" aparecendo com destaque, podemos ter certeza de que essa não é uma boa fonte de informações sobre cópulas!

Em vez disso, passemos a um livro-texto padrão e muito acessível, Uma introdução às cópulas ( Roger Edition, Second Edition, 2006), para as principais definições.

... toda cópula é uma função de distribuição conjunta com margens uniformes no [intervalo da unidade fechada .[0,1]]

[Na p. 23, embaixo.]

Para obter algumas dicas sobre cópulas, consulte o primeiro teorema do livro, o Teorema de Sklar :

Deixe- ser uma função de distribuição em conjunto com margens F e G . Existe uma cópula C tal que para todos x , y em [números reais estendidos], H ( x , y ) = C ( F ( x ) , G ( y ) ) .HFGCx,y

H(x,y)=C(F(x),G(y)).

[Apresentado nas páginas 18 e 21.]

Embora Nelsen não o chame como tal, ele define a cópula gaussiana em um exemplo:

... se denota a função de distribuição normal padrão (univariada) e N ρ denota a função de distribuição normal bivariada padrão (com o coeficiente de correlação produto-momento de Pearson ρ ), então ... C ( u , v ) = 1ΦNρρ

C(u,v)=12π1ρ2Φ1(u)Φ1(v)exp[(s22ρst+t2)2(1ρ2)]dsdt

[na p. 23, equação 2.3.6]. A partir da notação, é imediato que este seja de fato a distribuição conjunta de ( u , v ) quando ( Φ - 1 ( u ) , Φ - 1 ( v ) ) é bivariada Normal. Podemos agora virar-se e construir uma nova distribuição bivariável ter quaisquer distribuições marginais (contínua) desejados F e G para as quais esta C é a cópula, meramente por substituição destas ocorrências de Φ por F eC(u,v)(Φ1(u),Φ1(v))FGCΦF : tomeeste C particularna caracterização das cópulas acima.GC

Portanto, sim, isso se parece muito com as fórmulas para uma distribuição normal bivariada, porque é normal bivariada para as variáveis ​​transformadas . Como essas transformações não são lineares sempre que F e G ainda não são CDFs normais (univariados), a distribuição resultante não é (nesses casos) normal bivariada.(Φ1(F(x)),Φ1(G(y)))FG


Exemplo

F(4,2)XG(2)YHFGxy

Enredo

0x10y

A falta de simetria a torna obviamente fora do normal (e sem margens normais), mas, no entanto, possui uma cópula gaussiana por construção. FWIW tem uma fórmula e é feia, obviamente também não é bivariada Normal:

132(20(1x)x3)(eyy)exp(w(x,y))

w(x,y)

erfc1(2(Q(2,0,y))223(2erfc1(2(Q(2,0,y)))erfc1(2(Ix(4,2)))2)2).

QIx

whuber
fonte
Obrigado pela edição, @Cardinal: estou envergonhado por ter digitado incorretamente o nome de Nelsen, especialmente quando eu estava olhando direto para ele na frente do livro! (Em minha defesa, eu tinha notado pela primeira vez que na bibliografia de papel referenciada do OP, onde também está mal escrito: que deve ter preso com me :-).
whuber
Foi uma coisa tão pequena que achei que iria apenas em frente e fazer as edições. A ortografia é incomum (pelo menos em inglês!), Especialmente se comparada à variante mais comum. :-)
cardinal