Considere o modelo linear simples:
onde e , e contém uma coluna de constantes.
Meu questão é, dado , e , existe uma fórmula para um não trivial limite superior *? (assumindo que o modelo foi estimado pelo OLS).
* Eu assumi, escrevendo isso, que a obtenção de em si não seria possível.
EDIT1
utilizando a solução derivada por Stéphane Laurent (ver abaixo), podemos obter um não trivial limite superior . Algumas simulações numéricas (abaixo) mostram que esse limite é realmente muito apertado.
Stéphane Laurent derivou o seguinte: onde é uma distribuição Beta não central com parâmetro de não centralidade com
então
onde é um não central com parâmetro e graus de liberdade. Assim, um não-trivial limite superior para é
é muito apertado (muito mais apertado do que o que eu esperava seria possível):
por exemplo, usando:
rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)
a média dos mais de 1000 simulações é 0.960819
. O limite superior teórico acima fornece 0.9609081
. O limite parece ser igualmente precisos através de muitos valores de . Verdadeiramente surpreendente!
EDIT2:
depois de mais pesquisas, ele aparece que a qualidade da aproximação limite superior para vai ficar melhor como aumenta (e tudo o mais igual, aumenta com ).
fonte
Respostas:
Qualquer modelo linear pode ser escrito onde G tem a distribuição normal padrão em R n e μ é assumido como pertencendo a um subespaço linear W de R n . No seu caso, W = Im ( X ) .Y=μ+σG G Rn μ W Rn W=Im(X)
Deixe o subespaço linear unidimensional gerado pelo vector ( 1 , 1 , ... , 1 ) . Tomando L = [ 1 ] a seguir, o R 2 é altamente relacionada com a clássica Fisher estatística F = ‖ P Z Y ‖ 2 / ( m - ℓ )[1]⊂W (1,1,…,1) U=[1] R2
para o teste de hipótese deH0:{u∈L}ondeL⊂Wé um subespaço linear, e denotando por Z=L⊥∩Wo complemento ortogonal deLemW, e denotandom=dim(W)eℓ=dim(U)
De fato, porque a definição deR2seja R2= ‖ P Z Y ‖ dois
Obviamente e P ⊥ W Y = σ P ⊥ W L .PZY=PZμ+σPZG P⊥WY=σP⊥WG
Quando é verdadeiro,H0:{μ∈U} então e, portanto,
F = ″ P Z G ² 2 / ( m - ℓ )PZμ=0
tem adistribuiçãoFisherFm-ℓ,n-m. Consequentemente, a partir da relação clássica entre a distribuição de Fisher e a distribuição Beta,R2∼B(m-ℓ,n-m).
In the general situation we have to deal withPZY=PZμ+σPZG when PZμ≠0 . In this general case one has ∥PZY∥2∼σ2χ2m−ℓ(λ) , the noncentral χ2 distribution with m−ℓ degrees of freedom and noncentrality parameter λ=∥PZμ∥2σ2 F∼Fm−ℓ,n−m(λ) F
Finally let us write downPZμ . Note that PZ=PW−PU . One has PUμ=μ¯1 when U=[1] , and PWμ=μ . Hence PZμ=μ−μ¯1 where here μ=Xβ for the unknown parameters vector β .
fonte