Estou usando a regressão quantílica para encontrar preditores do percentil 90 dos meus dados. Estou fazendo isso no R usando o quantreg
pacote. Como posso determinar para a regressão quantílica, que indicará quanto da variabilidade está sendo explicado pelas variáveis preditoras?
O que eu realmente quero saber: "Qualquer método que eu possa usar para descobrir quanto da variabilidade está sendo explicado?". Os níveis de significância por valores de P está disponível na saída de comando: summary(rq(formula,tau,data))
. Como posso obter qualidade de ajuste?
Respostas:
Koenker e Machado [ 1 ] descrevem R 1 , uma medida local de qualidade de ajuste no (nomeadamente τ ) quantil.[1] R1 τ
SejaV(τ)=minb∑ρτ(yi−x′ib)
Deixe β ( τ ) e ~ β ( τ ) ser as estimativas dos coeficientes para o modelo completo, e um modelo restrito, e deixá- V e ~ V ser os correspondentes termos.β^(τ) β~(τ) V^ V~ V
Eles definem o critério de qualidade de ajuste .R1(τ)=1−V^V~
Koenker dá código para aqui ,V
Então, se nós de computação para um modelo com uma interceptação-only ( ~ V - ou , no trecho de código abaixo) e, em seguida, um modelo irrestrito ( V ), podemos calcular um que é - pelo menos teoricamente - um pouco como o de costume R 2 .V V~ V^ R2
V0
R1 <- 1-Vhat/V0
Editar: no seu caso, é claro, o segundo argumento, que seria colocado onde
f$tau
está a chamada na segunda linha de código, será o valor quetau
você usou. O valor na primeira linha apenas define o padrão.'Explicar variação sobre a média' não é realmente o que você está fazendo com a regressão quantílica; portanto, você não deve esperar ter uma medida realmente equivalente.
Eu não acho que o conceito de traduz bem a regressão quantílica. Você pode definir várias quantidades mais ou menos análogas, como aqui, mas não importa o que você escolhe, você não terá a maioria das propriedades reais R 2 tem em regressão OLS. Você precisa ser claro sobre quais propriedades precisa e o que não precisa - em alguns casos, pode ser possível ter uma medida que faça o que você deseja.R2 R2
-
Koenker, R e Machado, J (1999), Goodness of Fit e processos de inferência relacionados para regressão quantílica, Journal of the American Statistical Association,94: 448, 1296-1310.[1]
fonte
tau
quando chamar a função. Vou esclarecer no post.O pseudo- medida sugerido por Koenker e Machado (1999) em JASA mede qualidade do ajuste por comparação da soma de desvios ponderados para o modelo de interesse com a mesma soma a partir de um modelo em que apenas os aparece interceptam. É calculado comoR2
onde y i = ct τ + p τ x é o equipada τ th quantil para observação i , e ˉ y = p τ é o valor ajustado do modelo apenas de intercepção.y^i=ατ+βτx τ i y¯=βτ
deve estar em [ 0 , 1 ] , onde 1 corresponderia a um ajuste perfeito, pois o numerador que consiste na soma ponderada dos desvios seria zero. É umlocal demedida de ajuste para QRM uma vez que depende τ , ao contrário do mundial R 2 de OLS. Essa é sem dúvida a fonte dos avisos sobre o uso: se você modelar se encaixa na cauda, não há garantia de que se encaixa bem em qualquer outro lugar. Essa abordagem também pode ser usada para comparar modelos aninhados.R1(τ) [0,1] τ R2
Aqui está um exemplo em R:
Provavelmente isso poderia ser realizado de maneira mais elegante.
fonte
R_1(\tau) = 1 -
o último caractere é algum tipo de confusão. Você poderia verificar isso? Talvez você tenha colado algum caractere não-padrão em vez de usar o Tex.