Consequências da desigualdade de correlação gaussiana para calcular intervalos de confiança conjuntos

31

De acordo com este artigo muito interessante na Revista Quanta: "Uma prova de longa data, encontrada e quase perdida" , - foi provado que, dado um vetor com uma variável multivariada Distribuição gaussiana e com os intervalos centrados em torno das médias dos componentes correspondentes de , entãoI 1 , ... , I n xx=(x1,,xn)I1,,Inx

p(x1I1,...,xnEun)Eu=1np(xEuEuEu)

(Desigualdade de correlação gaussiana ou ICG; veja https://arxiv.org/pdf/1512.08776.pdf para a formulação mais geral).

Isso parece realmente agradável e simples, e o artigo diz que tem consequências para intervalos de confiança conjuntos. No entanto, parece-me bastante inútil a esse respeito. Suponha que estamos estimando parâmetros θ1,...,θn e encontramos estimadores θ1^,...,θn^ que são (talvez assintoticamente) conjuntamente normais (por exemplo, o estimador MLE) . Então, se eu calcular intervalos de confiança de 95% para cada parâmetro, o GCI garante que o hipercubo Eu1×...Eun é uma região de confiança conjunta com cobertura não inferior a (0,95)n ... o que é uma cobertura bastante baixa mesmo para moderado n .

Portanto, não parece uma maneira inteligente de encontrar regiões de confiança conjunta: a região de confiança usual para um gaussiano multivariado, isto é, um hiperelipsoide, não é difícil de encontrar se a matriz de covariância é conhecida e é mais nítida. Talvez seja útil encontrar regiões de confiança quando a matriz de covariância é desconhecida? Você pode me mostrar um exemplo da relevância da GCI para o cálculo de regiões de confiança conjunta?

DeltaIV
fonte
2
Você tem a ideia certa. Os intervalos de confiança individuais devem ser muito maiores que 95% para que a região da articulação atinja 95%. Cada um deve ter pelo menos 0,95 elevado à 1/5 de potência.
Michael R. Chernick 29/03
1
Uma correção pequena, mas importante: os intervalos devem ser todos centralizados em torno de zero, ou seja, I k = { x : | x | x k } . EukEuk={x:|x|xk}
Alex R.
1
@amoeba Não estou preocupado com a dificuldade da prova, mas com sua relevância para as estatísticas aplicadas. Se considerar um hiper-retângulo torna mais fácil mostrar essa relevância, é bom. Se você acha que essa desigualdade só se torna útil na prática quando um polígono arbitrário é considerado, é justo o suficiente. Aceitarei uma resposta que diga "se você considerar apenas hiper-retângulos, a GCI não é uma ferramenta muito útil para um estatístico aplicado, porque ... Mas se você considerar polígonos arbitrários, ela se tornará relevante, porque ..."
DeltaIV
1
Eu queria editar e procurar nos documentos com as provas, mas agora não tenho mais 100% de certeza se o hiper-retângulo é um caso fácil / especial ou uma formulação equivalente. Vou deixar por agora e talvez volte aqui mais tarde.
Ameba diz Reinstate Monica
1
hiper-retângulos centralizados na origem (onde com centralizado na origem, quero dizer que cada um dos intervalos 1D, cujo produto cartesiano define o hiper-retângulo, é simétrico em relação à origem) são definitivamente pelo menos um caso especial (não faço ideia se eles são um caso equivalente). De acordo com o artigo arXiv, a desigualdade é válida para todos os conjuntos convexos simétricos. Um hiper retângulo H é um conjunto convexo e, se estiver centrado na origem no sentido definido acima, será simétrico, ou seja, x = ( x 1 , , x n ) HH . x=(x1,...,xn)H-xH
DeltaIV

Respostas:

2

Eu acho que a questão é mais relevante. Em certo sentido, você está analisando vários testes de hipóteses e comparando com a execução de vários testes de hipóteses.

Sim, de fato, existe um limite inferior que é o produto dos valores-p dos testes que assumem independência. Essa é a base para ajustes nos valores de p em testes de multi-hipóteses, como ajustes de Bonferroni ou Holm. Mas os ajustes de Bonferroni e Holm (assumindo independência) são particularmente testes de baixa potência.

Pode-se fazer muito melhor na prática (e isso é feito via Bootstrap, veja, por exemplo, o Bootstrap Reality Check de H White, os artigos de Romano-Wolf e o conjunto mais recente de documentos sobre conjuntos de confiança de modelos). Cada uma delas é uma tentativa de um teste de hipótese de maior poder (por exemplo, usar a correlação estimada para fazer melhor do que simplesmente usar esse limite inferior) e, consequentemente, muito mais relevante.

NBF
fonte