Existe uma distribuição de junta paramétrica tal que e sejam uniformes em (isto é, uma cópula) e é linear (com o que quero dizer afim) em ? Ou seja,
É claro que eu poderia deixar e independentes, nesse caso . Existem cópulas paramétricas simples que satisfazem minhas restrições sem que as duas variáveis sejam independentes? (Outro caso de borda seria e .)
Note-se que a e em possui apenas um grau de liberdade, uma vez que .
Alguma motivação do mundo real para tornar isso menos abstrato: a pesquisa de Chetty et al. Sobre mobilidade intergeracional de renda encontra (aproximadamente) cópulas lineares de renda (isto é, uma relação aproximadamente linear entre a classificação de renda dos pais e a renda dos filhos). Consulte http://www.rajchetty.com/chettyfiles/mobility_trends_published.pdf (Figura 1. Classificação da renda infantil versus classificação da renda dos pais por coorte de nascimento) e http://www.rajchetty.com/chettyfiles/mobility_geo.pdf (Figura II : Associação entre as classificações percentuais das crianças e dos pais).
Respostas:
Podemos desenvolver famílias paramétricas ricas a partir da solução trivial com cópula , o caso de correlação perfeita (positiva) e sua contrapartida para uma correlação negativa perfeita. Concentrar a probabilidade ao longo do segmento de linha que liga a com fornece a cópulaF(x,y)=min(x,y) (0,α) (1,β) β>α
Uma cópula semelhante surge quando , que também designarei .β<α F(x,y;α,β)
Pense nisto como misturas: quando , existem componentes uniformes nos retângulos horizontais , , e no retângulo central existe uma correlação perfeita (cuja distribuição é a de para uma variável uniformemente distribuída ) Essa concepção de facilita o cálculo da regressão: é uma soma ponderada das três médias condicionais,β>α [0,1]×[0,α] [0,1]×[β,1] [0,1]×[α,β] (U,α+(β−α)U) U F
Evidentemente, isso é linear em : a interceptação é igual a e a inclinação é vezes o sinal de . Além disso, foi construído para ter marginais uniformes.X (1+(β−α)2)/2 (β−α)2 β−α
Para criar uma família paramétrica, escolha qualquer distribuição paramétrica para com o parâmetro . Seja a função de distribuição. Descreve uma mistura de via integração:(α,β) θ G(α,β;θ) F(;α,β)
é a função de distribuição (cópula). Como cada possui marginais uniformes, o mesmo acontece com . Além disso, sua regressão é linear porqueF(;α,β) F~(;θ)
Isso mostra como o intercepto e a inclinação são as expectativas da interceptação e da inclinação (em relação a ), fornecendo informações úteis para selecionar as famílias apropriadas .G G(;θ)
Esses gráficos documentam uma simulação de uma dessas famílias. Aqui, foi extraído de uma distribuição Beta e foi extraído independentemente de uma distribuição Beta . A primeira coluna mostra histogramas das realizações desses parâmetros. A segunda coluna mostra histogramas das distribuições marginais de e : elas são satisfatoriamente próximas de uniformes. A coluna mais à direita mostra um subconjunto aleatório dos 100.000 valores simulados, juntamente com uma estimativa de sua regressão (linha vermelha) e uma aproximação à regressão teórica (linha pontilhada preta): eles concordam estreitamente. A regressão estimada foi obtida calculando-se as médias deα (5,1) β (3,10) X Y X e dentro das janelas do , depois suavizando o traço com Loess.Y X
(A linha de regressão "teórica" é apenas uma aproximação obtida substituindo e nas fórmulas de expectativa por suas expectativas. As fórmulas exatas são fáceis de resolver nesse caso, mas são longas e complicadas de codificar.)α β
OG(;θ)
R
código que produziu essa figura pode ser facilmente usado para estudar outras famílias .fonte