Como calcular bandas de previsão para regressão não linear?

15

A página de ajuda do Prism fornece a seguinte explicação sobre como ele calcula as bandas de previsão para regressão não linear. Por favor, desculpe a citação longa, mas não estou seguindo o segundo parágrafo (que explica como é definido ed d Y / d P é calculado). Qualquer ajuda seria muito apreciada.G|xdY/dP

O cálculo das faixas de confiança e previsão é bastante padrão. Continue lendo para obter detalhes de como o Prism calcula as faixas de previsão e confiança da regressão não linear.

Primeiro, vamos definir G | x, que é o gradiente dos parâmetros em um valor específico de X e usando todos os valores de melhor ajuste dos parâmetros. O resultado é um vetor, com um elemento por parâmetro. Para cada parâmetro, é definido como dY / dP, em que Y é o valor Y da curva, dado o valor específico de X e todos os valores de parâmetros de melhor ajuste e P é um dos parâmetros.)

G '| x é esse vetor de gradiente transposto, portanto é uma coluna e não uma linha de valores.

Cov é a matriz de covariância (Hessian inverso da última iteração). É uma matriz quadrada com o número de linhas e colunas igual ao número de parâmetros. Cada item da matriz é a covariância entre dois parâmetros.

Agora calcule c = G '| x * Cov * G | x. O resultado é um número único para qualquer valor de X.

As faixas de confiança e previsão são centralizadas na curva de melhor ajuste e se estendem acima e abaixo da curva em uma quantidade igual.

As faixas de confiança se estendem acima e abaixo da curva em: = sqrt (c) * sqrt (SS / DF) * CriticalT (% de confiança, DF)

As bandas de previsão estendem uma distância adicional acima e abaixo da curva, igual a: = sqrt (c + 1) * sqrt (SS / DF) * CriticalT (% de confiança, DF)

Joe Listerr
fonte
Espero que isso ajude: stats.stackexchange.com/questions/74334/…
Bipi
Espero que isso ajude: stats.stackexchange.com/questions/74334/…
Bipi
Isso é realmente conhecido como método delta e usa uma aproximação de Taylor de primeira ordem. É melhor usar uma aproximação de Taylor de segunda ordem para isso - a função predictNLS no pacote de propagação faz isso se você estiver interessado!
Tom Wenseleers

Respostas:

18

Isso é chamado de método Delta.

Suponha que você tenha alguma função ; note que G ( ) é uma função dos parâmetros que você estima, β e os valores de seus preditores, x . Primeiro, encontre a derivada dessa função com relação ao seu vetor de parâmetros, β : G ( β , x )y=G(β,x)+ϵG()βxβG(β,x). Isto diz que, se você alterar um parâmetro um pouco, quanto sua função muda? Observe que essa derivada pode ser uma função dos seus próprios parâmetros, bem como dos preditores. Por exemplo, se , a derivada é x exp ( β x ) , que depende do valor de β e do valor de x . Para avaliar isso, você conecta a estimativa de β que o seu procedimento dá, β , eo valor do preditor xG(β,x)=exp(βx)xexp(βx)βxββ^x onde você deseja a previsão.

O método delta, derivada a partir de procedimentos de probabilidade máxima, estados que a variância de vai ser L ' ( β , x ) T Var ( β ) L ' ( β , x ) , onde var ( β )G(β^,x)

G(β^,x)TVar(β^)G(β^,x),
Var(β^)é a matriz de variância-covariância de suas estimativas (isso é igual ao inverso do Hessiano - as segundas derivadas da função de verossimilhança em suas estimativas). A função que seus pacotes estatísticos empregam calcula esse valor para cada valor diferente do preditor . Este é apenas um número, não um vetor, para cada valor de x .xx

Isso fornece a variação do valor da função em cada ponto e é usada como qualquer outra variação no cálculo dos intervalos de confiança: pegue a raiz quadrada desse valor, multiplique pelo valor crítico para a distribuição t normal ou aplicável relevante para uma nível de confiança específico e adicione e subtraia esse valor à estimativa de no ponto.G()

Para intervalos de predição, precisamos tomar a variação do resultado dado os preditores , Var ( y | x ) σ 2 , em conta. Por isso, temos de aumentar a nossa variância do método delta por nossa estimativa da variação de ε , σ 2 , para obter a variância de y , ao invés da variação do valor esperado de y que é usado para intervalos de confiança. Note-se que σ 2 é a soma dos quadrados dos erros ( na notação arquivo de ajuda) dividido pelos graus de liberdade ( ).xVar(yx)σ2ϵσ^2yyσ^2SSDF

cσ2σ2σc*SS/DF

c(xx)1Var(β^)=σ2(xx)1

Charlie
fonte
Você pode explicar o cálculo ci? Não parece ponto crítico de t * sqrt (var)
B_Miner
Eu acho que entendo o cálculo deles; Eu atualizei minha resposta.
Charlie
Charlie, muito obrigado por uma resposta detalhada. Pretendo escrever código para poder calcular a faixa de previsão de 95%. Eu vou deixar você saber como isso vai.
Joe Listerr
@ Charlie - muito, muito bom!
B_Miner
2
@Charlie. Obrigado. Adicionei uma frase às Perguntas frequentes sobre o GraphPad Prism, explicando que usamos cov para significar a matriz de covariância normalizada (cada valor varia de -1 a 1). Também adicionei um link para esta página, o que é ótimo para quem procura detalhes matemáticos.
Harvey Motulsky