Como interpretar os valores P do GAM?

Meu nome é Hugh e sou um estudante de doutorado usando modelos aditivos generalizados para fazer algumas análises exploratórias.

Não tenho certeza de como interpretar os valores-p que vêm do pacote MGCV e gostaria de verificar meu entendimento (estou usando a versão 1.7-29 e consultei algumas das documentações de Simon Wood). Procurei outras questões de CV primeiro, mas as mais relevantes parecem ser sobre regressões gerais, não os valores de p do GAM em particular.

Eu sei que existem muitos argumentos diferentes para o GAM, e os valores-p são apenas aproximados. Mas estou apenas começando a ver se há algum "sinal" para minhas covariáveis. Por exemplo:

Matemática5 pontosQual é a raiz quadrada de 2? (-5) + (-5) + (-7) + (-7) + (-7)

Valores-p aproximados de termos suaves:

s (a) = 0,000473
s (b) = 1.13e-05
s (c) = 0,000736
s (d) = 0,887579
s (e) = 0,234017

R ² (ajustado) = 0,62 Desvio explicado = 63,7% pontuação GCV = 411,17 Escala est. = 390,1 n = 120 $\quad$
$\quad$ $\quad$

Cortei as colunas df, etc., devido à formatação. Estou interpretando os valores de p para cada covariável como um teste para saber se a função suave correspondente reduz significativamente o desvio do modelo, em que p é a probabilidade de obter dados pelo menos tão 'relativamente implausíveis' como o observado em um modelo nulo de 0.

Isso significaria que (por exemplo, com alfa = 0,05) as funções suavizadas não reduziram o desvio para "d" e "e" vs. um modelo nulo, enquanto o fizeram para os outros termos. Portanto (d) e (e) não adicionam informações significativas à regressão, e o desvio explicado se reduz a (a) (b) (c)?

Qualquer conselho seria muito apreciado, e boa sorte com sua pesquisa.

p-value mgcv user45178
fonte

Respostas:

O artigo que descreve como eles funcionam está aqui .

São valores de p associados aos testes de Wald que a função inteira s (.) = 0. Valores baixos de p indicam baixa probabilidade de que os splines que compõem a função sejam conjuntamente zero.

O mais complicado deles é que eles envolvem um pseudoinverso de posição reduzida. O teste típico de Wald é . Você pode ver imediatamente que esse é um teste t no caso univariado (ou seja, não matrizes, mas beta e variância). Isso fornece uma potência realmente baixa no caso de splines penalizados porque esses coeficientes são penalizados. O pseudo-inverso rank-r é responsável por isso. O artigo é realmente bastante denso, mas quando você obtém a essência geral - melhorando o poder de um teste contabilizando a EDF em vez da classificação da matriz - torna-se possível seguir o formalismo. $\hat f (V_\beta)^{-1} \hat f$

generic_user
fonte