O teste F clássico para subconjuntos de variáveis na regressão multilinear tem a forma queSSE(R)é a soma dos erros quadráticos no modelo 'reduzido', que se aninha dentro do modelo 'grande'Bedfsão os graus de liberdade dos dois modelos. Sob a hipótese nula de que as variáveis extras no modelo "grande" não têm poder explicativo linear, a estatística é distribuída como um F comgraus de liberdadedfR-dfBedfB.
Qual é a distribuição, no entanto, sob a alternativa? Suponho que seja um F não central (espero não duplamente não central), mas não consigo encontrar nenhuma referência sobre qual é exatamente o parâmetro não central. Acho que depende dos verdadeiros coeficientes de regressão e provavelmente da matriz de design X , mas além disso não tenho tanta certeza.
Aqui está o código R (perdoe o estilo, ainda estou aprendendo):
fonte