Estou procurando o valor assintótico ( ) de (o logaritmo do determinante) da covariância da % de observações com a menor distância euclidiana da origem em uma amostra de tamanho extraída de, digamos, uma bivariada gaussiano padrão.
- O hiper-volume de uma elipse é proporcional ao determinante de sua matriz de covariância, daí o título.
--Por padrão gaussiano bivariado, quero dizer onde é um vetor de 0 de comprimento 2 e é a matriz de identidade rank 2 .---
É fácil ver por simulações do que quando o número é de cerca de :
library(MASS)
n<-10000
p<-2
x<-mvrnorm(n,rep(0,p),diag(2))
h<-ceiling(0.714286*n)
p<-ncol(x)
w<-mahalanobis(x,rep(0,p),diag(p),inverted=TRUE) #These are eucledian distances, because the covariance used is the identity matrix
s<-(1:n)[order(w)][1:h]
log(det(cov(x[s,])))
mas não me lembro de como obter uma expressão exata (ou, na sua falta, uma melhor aproximação) para isso.
r
mathematical-statistics
simulation
user603
fonte
fonte
Respostas:
Ok, essa pergunta parece surgir de tempos em tempos, então eu acho que vou dar uma resposta geral.
Em [1], os autores mostram que se com Σ simétrica definida, e positivo S αxxEu∼ Np( μμ , ΣΣ) , i = 1 , … , n Σ Sα
para eqα= χ2p( Α ) ,0 < α ⩽ 1
Então, assintoticamente, converge para l α Σ ondeCα euαΣ
Essa aproximação é realmente boa (aqui para alpha = 60/70):
Então, finalmente, para responder à pergunta, o determinante da matriz de covariância das [ α n ] observações com a menor norma euclediana até a origem (este é o caso particular em que Σ = Iregistro [ α n ] e μΣ= IEup μμ = 00 0p
fonte