Por que o LKJcorr é um bom prior para a matriz de correlação?

11

Estou lendo o capítulo 13 "Adventures in Covariance" no ( excelente ) livro Statistical Rethinking de Richard McElreath, onde ele apresenta o seguinte modelo hierárquico:

Modelo

( Ré uma matriz de correlação)

O autor explica que LKJcorré um prior fracamente informativo que funciona como um priorizador de regularização para matriz de correlação. Mas por que é assim? Quais são as características da LKJcorrdistribuição que a tornam uma boa prévia para matrizes de correlação? Quais são os outros bons antecedentes usados ​​na prática para matrizes de correlação?

xboard
fonte

Respostas:

8

A distribuição LKJ é uma extensão do trabalho de H. Joe (1). Joe propôs um procedimento para gerar matrizes de correlação uniformemente no espaço de todas as matrizes de correlação definidas positivas. A contribuição de (2) é que ela estende o trabalho de Joe para mostrar que existe uma maneira mais eficiente de gerar tais amostras.

Eu

Uma maneira alternativa de amostragem de matrizes de correlação, chamada método "cebola", é encontrada em (3). (Nenhuma relação com a revista satírica - provavelmente.)

Outra alternativa é coletar amostras das distribuições Wishart, que são semi-definidas positivas, e depois dividir as variações para deixar uma matriz de correlação. O problema com as distribuições do tipo Wishart é que as variedades não informativas são singulares ou numericamente singulares com alta probabilidade; portanto, os métodos de amostragem são lentos quando é necessário que a amostra seja (numérica) não singular.

(1) H. Joe. "Gerando matrizes de correlação aleatória com base em correlações parciais." Jornal de Análise Multivariada , 97 (2006), pp. 2177-2189

(2) Daniel Lewandowski, Dorota Kurowicka, Harry Joe. "Gerando matrizes aleatórias de correlação baseadas em videiras e método de cebola estendida." Journal of Multivariate Analysis , Volume 100, Edição 9, 2009, Páginas 1989-2001

(3) S. Ghosh, SG Henderson. "Comportamento do método norta para geração de vetores aleatórios correlacionados à medida que a dimensão aumenta". Transações ACM em Modelagem e Simulação Computacional (TOMACS), 13 (3) (2003), pp. 276-294

Sycorax diz restabelecer Monica
fonte