Funções de perda de percentil

11

A solução para o problema:

minmE[|mX|]

é conhecido por ser a mediana de X , mas como é a função de perda para outros percentis? Ex: o 25º percentil de X é a solução para:

minmE[L(m,X)]

O que é L neste caso?

Cam.Davidson.Pilon
fonte

Respostas:

12

Seja I a função indicadora: é igual a 1 para argumentos verdadeiros e 0 contrário. Escolha 0<α<1 e defina

Λα(x)=αxI(x0)(1α)xI(x<0).

Figura

Esta figura plota Λ1/5 . Ele usa uma proporção precisa para ajudá-lo a medir as inclinações, que são iguais a 4/5 no lado esquerdo e +1/5 no lado direito. Nesse caso, excursões acima de 0 são pesadamente reduzidas em comparação com excursões abaixo de 0 .

Essa é uma função natural a ser tentada, porque pesa valores que excedem diferente de que são menores que . Vamos calcular a perda associada e, em seguida, otimizá-la.0 x 0x0x0

Escrevendo para a função de distribuição de e configurando , calculeX L α ( m , x ) = Λ α ( x - m )FXLα(m,x)=Λα(xm)

EF(Lα(m,X))=RΛα(xm)dF(x)=αRI(xm)(xm)dF(x)(1α)R(xm)I(x<m)dF(x)=αm(xm)dF(x)(1α)m(xm)dF(x).

Figura 2

Como varia nesta ilustração com a distribuição Normal Padrão , a área total ponderada pela probabilidade de é plotada. (A curva é o gráfico de .) A plotagem à direita para mostra mais claramente o efeito da ponderação reduzida dos valores positivos, pois sem essa ponderação reduzida a plotagem seria seja simétrico sobre a origem. O gráfico do meio mostra o ideal, onde a quantidade total de tinta azul (representando ) é a menor possível.F Λ 1 / 5 Λ 1 / 5 ( x - m ) d F ( x ) m = 0 E F ( G 1 / 5 ( m , X ) )mFΛ1/5Λ1/5(xm)dF(x)m=0EF(L1/5(m,X)) 

Essa função é diferenciável e, portanto, seus extremos podem ser encontrados através da inspeção dos pontos críticos. A aplicação da Regra da Cadeia e do Teorema Fundamental do Cálculo para obter a derivada em relação a dám

mEF(Lα(m,X))=α(0mdF(x))(1α)(0mdF(x))=F(m)α.

Para distribuições contínuas esta tem sempre uma soluo que, por definição, é qualquer quantil de . Para as distribuições não contínuos isto poderá não ter uma solução, mas não haverá, pelo menos, uma para que para todos os e para todos : isto também (por definição) é um quantil de .α X m F ( x ) - α < 0 x < m F ( x ) - α 0 x m α XmαXmF(x)α<0x<mF(x)α0xmαX

Finalmente, como e , fica claro que nem nem minimizarão essa perda. Isso esgota a inspeção dos pontos críticos, mostrando que se encaixa na conta.α 1 m - m Λ αα0α1mmΛα

Como um caso especial, é a perda exibida no questão.EF(2L1/2(m,X))=EF(|mx|)

whuber
fonte
Agradeço o esforço que você faz para mostrar que a perda esperada é minimizada pelo ponto correto . Fiquei me perguntando como fazer isso sozinho para minha própria resposta, mas sua explicação é boa. (+1)m
2
Você provou que as imagens valem 1000 palavras. Obrigado @whuber =)
Cam.Davidson.Pilon
8

Este artigo tem sua resposta. Para ser específico, A função de perda pode ser interpretada como 'equilibrando' as diferentes regiões de massa de probabilidade em torno de através da subtração . Para a mediana, essas regiões de massa são iguais: tornando a função de perda proporcional (na expectativa de que a constante seja negligenciável) a que fornece a conclusão desejada para a mediana.0,25 0,25 - 1 { X > m } L 0,5 ( m , X ) = | ( X - m ) ( 0,5 - 1 { X > m } ) |

L0.25(m,X)=|(Xm)(0.251{X>m})|.
0.250.251{X>m}| X - m | ,
L0.5(m,X)=|(Xm)(0.51{X>m})|=|(Xm)×±0.5|,
|Xm|,

fonte
(+1) Muito bem! - não era óbvio onde procurar aquele artigo da Wikipedia; você tinha que pensar em regressão quantílica.
whuber
Obrigado, Matthew, esta é uma ótima descoberta. Eu gosto de balancear a interpretação
Cam.Davidson.Pilon
Ainda não entendi. De onde vem isto? Se X estiver acima do quantil, será ponderado 0,75, caso contrário 0,25? Só isso? ( X - m )|(0.25)1X>m)|(Xm)
precisa saber é o seguinte