O que é a relação entre

17

Eu queria saber se existe uma relação entre e um teste-F.R2

Normalmente,

R2=(Y^tY¯)2/T1(YtY¯)2/T1
e mede a intensidade da relação linear na regressão.

Um teste F apenas prova uma hipótese.

Existe uma relação entre R2 e F-Test?

Le Max
fonte
2
A fórmula para R2 aparência incorreta, não só porque está faltando alguns caracteres no denominador: aqueles " 1 " termos não pertencem. A fórmula correta se parece muito mais com uma estatística F :-).
whuber

Respostas:

23

Se todos os pressupostos segurar e você tem a forma correta para , em seguida, a estatística F habitual pode ser calculado como F = R 2R2 . Esse valor pode ser comparado à distribuição F apropriada para fazer um teste F. Isso pode ser derivado / confirmado com álgebra básica.F=R21R2×df2df1

Greg Snow
fonte
2
você poderia por favor definir DF1 e DF2?
bonobo
1
@bonobo, df1 é o grau de liberdade do numerador (com base no número de preditores) e df2 é o grau de liberdade do denominador.
Greg Neve
1
Para esclarecer mais sobre os graus de liberdade: df1 = k, onde k é o número de preditores. df1 é chamado de "graus de liberdade do numerador", mesmo que esteja no denominador nesta fórmula. df2 = n− (k + 1), em que n é o número de observações e k é o número de preditores. df2 é chamado de "graus de liberdade do denominador", mesmo que esteja no numerador dessa fórmula.
Tim Swast
5
@GregSnow, você poderia considerar adicionar as definições dos graus de liberdade à resposta? Sugeri essa alteração em stats.stackexchange.com/review/suggested-edits/175306, mas ela foi rejeitada.
Tim Swast
22

Lembre-se de que em uma configuração de regressão, a estatística F é expressa da seguinte maneira.

F=(TSSRSS)/(p1)RSS/(np)

onde TSS = soma total dos quadrados e RSS = soma residual dos quadrados, é o número de preditores (incluindo a constante) en é o número de observações. Esta estatística tem um F distribuição com graus de liberdade p - 1 e n - ppnFp1np .

Lembre-se também de que

R2=1RSSTSS=TSSRSSTSS

álgebra simples dirá que

R2=1(1+Fp1np)1

onde F é a estatística F de cima.

Esta é a relação teórica entre a estatística F (ou o teste F) e .R2

A interpretação prática é que um maior conduzem a elevados valores de F, por isso, se R 2 for grande (o que significa que um modelo linear se ajusta aos dados assim), então a estatística F correspondente deve ser grande, o que significa que não deva Há fortes evidências de que pelo menos alguns dos coeficientes são diferentes de zero.R2R2

Zheng Li
fonte
1

Intuitivamente, gosto de pensar que o resultado da razão F primeiro dá uma resposta sim-não à pergunta 'posso rejeitar ?' (é determinado se a razão for muito maior que 1 ou o valor de p < αH0α ).

Então, se eu determinar, posso rejeitar , R 2H0R2 , em seguida indica a força da relação entre eles.

Em outras palavras, uma grande proporção F indica que existe um relacionamento. Alto indica quão forte é essa relação.R2

Entropica
fonte
-1

Além disso, rapidamente:

R2 = F / (F + np / p-1)

Por exemplo, o R2 de um teste de 1df F = 2,53 com tamanho de amostra 21 seria:

R2 = 2,53 / (2,53 + 19) R2 = 0,175

rystoli
fonte
1
Não vejo como isso acrescenta algo além do que já está na resposta de Zheng Li.
Glen_b -Reinstala Monica