Linha de Referência do Gráfico QQ não 45 °

10

Eu estava plotando (padronizado) dados de retorno qqplot()no MATLAB contra os quantis teóricos de uma distribuição normal. No entanto, a linha no QQ-Plot não possui um ângulo de 45 °, mas é girada um pouco.

Talvez eu entenda mal o conceito de um gráfico de QQ, mas não deveria ser exatamente uma linha de 45 °?

Eu coloquei o enredo para ilustrar a questão.

Gráfico QQ de dados de retorno padronizados

mscnvrsy
fonte
Sabe-se que os dados de retorno padronizados não são normais; então, por que eles estariam em uma linha de 45 graus? Os retornos são mais pesados ​​que o normal e é isso que seus dados também mostram.
Glen_b -Reinstala Monica
Estou ciente da não normalidade e que os pontos não devem estar na linha em si. Fiquei me perguntando por que a linha não é de 45 °.
mscnvrsy
Oh, desculpe, isso não estava claro. Eu postei uma resposta.
Glen_b -Reinstate Monica

Respostas:

18

Deve ser uma linha de 45 graus? Depende!

Um gráfico QQ é a curva paramétrica definida por:

x=F1(p)y=G1(p)

para . Onde e são funções CDF inversas.p[0,1]F1G1

Se então e estaria em uma linha de 45 graus.F=Gx(p)=y(p)

Outro caso ...

  • Seja o CDF inverso normal padrão.Φ1(p)
  • SejaF1(p)=Φ1(p)
  • SejaG1(p)=σΦ1(p)+μ

Ou seja, é o CDF inverso para uma variável aleatória distribuída normalmente com média e desvio padrão enquanto é o CDF inverso para uma variável normal padrão (ou seja, média 0, desvio padrão 1). Então vemos:GμσF

y(p)=σΦ1(p)+μ=σx(p)+μ

Ou seja, o gráfico é uma linhay=σx+μ

O que está acontecendo no seu caso?

Na documentação do Matlab paraqqplot

Sobreposta à plotagem está uma linha que une o primeiro e o terceiro quartis de cada distribuição (este é um ajuste linear robusto das estatísticas de ordem das duas amostras). Essa linha é extrapolada para as extremidades da amostra para ajudar a avaliar a linearidade dos dados.

Portanto, mesmo se você padronizar seus dados, os gráficos MATLAB da linha vermelha não seriam de 45 graus se o primeiro e o terceiro quartis não correspondessem à distribuição normal.

Matthew Gunn
fonte
Obrigado! Eu pensei que a linha vermelha é construída para que você possa ver os desvios dos quantis normais padrão? Quando eu uso dados padronizados, a linha deve ser y = x então, não deveria?
mscnvrsy
@mscnvrsy A linha vermelha que eu acho no MATLAB é construída para mostrar o que deveria ser se seus dados seguissem a distribuição normal.
Matthew Gunn
Existe alguma maneira de obter uma linha de 45 ° como linha de referência? Eu pensei que isso poderia ser alcançado pela padronização.
mscnvrsy
@mscnvrsy hmmm .... Estou confuso agora onde linha vermelha do MATLAB na QQPlot é proveniente de: P Me dê um segundo ... eu estou verificando o código-fonte ...
Matthew Gunn
Para mim, parece mais um ajuste OLS. Infelizmente, porém, não é possível definir parâmetros relevantes no arquivo qqplot().
mscnvrsy
2

Como a linha é determinada varia de pacote para pacote, mas uma maneira comum é unir o ponto do quartil inferior ao ponto do quartil superior .( 0,6745 , Q 3 )(x,y)=(0.6745,Q1)(0.6745,Q3)

Olhando para a ajuda do Matlab para o qqplot, é o que diz que o Matlab faz.

A distribuição da amostra é pontual e de cauda pesada, de maneira a aproximar seus quartis do que para um normal com o mesmo desvio padrão, o que torna a inclinação mais próxima de 0,7 do que de 1.

Glen_b -Reinstate Monica
fonte