Espero obter uma explicação intuitiva e acessível da regressão quantílica.
Digamos que eu tenha um conjunto de dados simples do resultado e preditores .
Se, por exemplo, eu executar uma regressão quantílica em 0,25, 0,5, 0,75 e retornar .
Os valores de são encontrados simplesmente ordenando os valores de e realizando uma regressão linear com base nos exemplos que estão no / próximo ao quantil fornecido?
Ou todas as amostras contribuem para as estimativas , com pesos descendentes à medida que a distância do quantil aumenta?
Ou é algo totalmente diferente? Ainda não encontrei uma explicação acessível.
quantile-regression
Jeremy
fonte
fonte
Respostas:
Eu recomendo Koenker & Hallock (2001, Journal of Economic Perspectives) e o livro de mesmo nome de Koenker .
Portanto, sua intuição está correta: todas as amostras contribuem para as estimativas , com pesos assimétricos, dependendo do quantil τ que almejamos .β τ
fonte
foo <- sample(x=c(1,2,4,10),size=1e6,prob=c(.4,.2,.2,.2),replace=TRUE); xx <- seq(1,10,by=.1); plot(xx,sapply(xx,FUN=function(yy)mean(abs(yy-foo))),type="l")
A idéia básica da regressão quantílica vem do fato de o analista estar interessado na distribuição de dados, e não apenas na média dos dados. Vamos começar com a média.
A regressão média ajusta uma linha da forma de à média dos dados. Em outras palavras, E ( Y | X = x ) = x β . Uma abordagem geral para estimar esta linha está usando o método dos mínimos quadrados, arg min β ( y - x β ) ′ ( yy= Xβ E( Y| X= x ) = x β .argminβ( y- x β)′( y- Xβ)
Por outro lado, a regressão mediana procura uma linha que espera que metade dos dados esteja em lados opostos. Nesse caso, a função alvo é Ondeargminβ| y- Xβ| é a primeira norma.| . |
Estendendo a idéia de mediana para resultados quantis em regressão quantílica. A idéia por trás disso é encontrar uma linha em que percentagem de dados esteja além disso.α
Aqui você cometeu um pequeno erro: a regressão Q não é como encontrar um quantil de dados e ajustar uma linha a esse subconjunto (ou até as fronteiras que são mais desafiadoras).
A regressão Q procura uma linha que divide os dados em um qroup a quantil e o restante . Função de destino, dizendo função de verificação de Q-regressão é β alfa = arg min β { alfa | y - X β | I ( y > X β ) + ( 1 - α ) | y - X β | I ( y < X β ) } .α
Como você vê, essa função inteligente de destino nada mais é do que traduzir quantil para um problema de otimização.
Além disso, como você vê, a regressão Q é definida para um determinado número (βα ) e, em seguida, pode ser estendida para encontrar todos os quantis. Em outras palavras, a regressão Q pode reproduzir a distribuição (condicional) da resposta.
fonte