Em que acreditar: teste de Kolmogorov-Smirnov ou plot QQ?

16

Estou tentando determinar se meu conjunto de dados de dados contínuos segue uma distribuição gama com os parâmetros shape 1.7 e rate 0.000063.==

O problema é que quando eu uso R para criar um gráfico QQ do meu conjunto de dados relação à distribuição teórica gama (1,7, 0,000063), recebo um gráfico que mostra que os dados empíricos concordam aproximadamente com a distribuição gama. O mesmo acontece com o gráfico ECDF.x

No entanto, quando executo um teste de Kolmogorov-Smirnov, ele me fornece um valor- razoavelmente pequeno de .p<1%

Em que devo escolher acreditar? A saída gráfica ou o resultado do teste KS?

Gráfico QQplot e ECDF

user22119
fonte
você também pode fornecer os gráficos de distribuição de densidade que obtém?
Risque
13
O teste e o gráfico de diagnóstico não são inconsistentes. A distribuição é semelhante à teórica, como mostra o gráfico QQ. O tamanho da amostra é grande o suficiente para que você possa perceber até mesmo pequenas diferenças da teórica.
Glen_b -Reinstate Monica

Respostas:

18

Não vejo sentido em "não acreditar" no enredo QQ (se você o produziu corretamente); é apenas uma representação gráfica da realidade de seus dados, justaposta à distribuição de definição. Claramente, não é uma combinação perfeita, mas se for boa o suficiente para seus propósitos, pode ser mais ou menos o fim da história. Você pode querer verificar esta pergunta relacionada: O teste de normalidade é 'essencialmente inútil'?

p

Se os seus dados são muito diferentes de uma distribuição gama para os objetivos pretendidos é outra questão. Somente o teste KS não pode respondê-lo (porque o resultado dependerá do tamanho da amostra, entre outros motivos), mas o gráfico QQ pode ajudá-lo a decidir. Você também pode procurar alternativas robustas para quaisquer outras análises que planeja executar, e se você é particularmente sério em considerar a sensibilidade de qualquer análise subsequente a desvios da distribuição gama, convém fazer alguns testes de simulação também .

Nick Stauner
fonte
15

O que você pode fazer é criar várias amostras da sua distribuição teórica e plotar aquelas no fundo do seu QQ-plot. Isso lhe dará uma idéia de que tipo de variabilidade você pode razoavelmente esperar de apenas amostragem.

Você pode estender essa ideia para criar um envelope em torno da linha teórica, usando o exemplo das páginas 86-89 de:

Venables, WN e Ripley, BD 2002. Estatísticas modernas aplicadas com S. New York: Springer.

Este será um envelope pontual. Você pode estender ainda mais essa idéia para criar um envelope geral usando as idéias das páginas 151-154 de:

Davison, AC e Hinkley, DV 1997. Métodos de inicialização e sua aplicação. Cambridge: Cambridge University Press.

No entanto, para a exploração básica, acho que apenas plotar algumas amostras de referência no plano de fundo do seu QQ-plot será mais que suficiente.

Maarten Buis
fonte
Boa ideia! Lembre-me de votar em 11 horas (usei todos os meus votos em desenhos animados ) ... Gosto particularmente de iniciar o ECDF como uma maneira de enriquecer esse tipo de enredo.
Nick Stauner
1
Dê uma olhada também no pacote CRAN sfsmisc, que tem a função ecdf.ksCI, que gera uma banda de confiança no gráfico ecdf. A mesma idéia pode ser usada para desenhar uma faixa de confiança na trama QQ ...
b Kjetil Halvorsen
2

O teste KS assume parâmetros específicos da sua distribuição. Ele testa a hipótese "os dados são distribuídos de acordo com essa distribuição específica". Você pode ter especificado esses parâmetros em algum lugar. Caso contrário, alguns padrões não correspondentes podem ter sido usados. Observe que o teste KS se tornará conservador se os parâmetros estimados forem conectados à hipótese.

No entanto, a maioria dos testes de ajuste é usada de maneira errada. Se o teste KS não tivesse mostrado significância, isso não significa que o modelo que você queria provar é apropriado. Foi o que @Nick Stauner disse sobre um tamanho de amostra muito pequeno. Esse problema é semelhante aos testes de hipótese pontual e de equivalência.

Então, no final: considere apenas os gráficos QQ.

Horst Grünbusch
fonte
-1

QQ Plot é uma técnica de análise de dados exploratória e deve ser tratada como tal - assim como todas as outras parcelas da EDA. Eles servem apenas para fornecer informações preliminares sobre os dados disponíveis. Você nunca deve decidir ou interromper sua análise com base em gráficos da EDA, como o gráfico QQ. É um conselho errado considerar apenas gráficos QQ. Você definitivamente deve seguir técnicas quantitativas como o KS Test. Suponha que você tenha outro gráfico de QQ para um conjunto de dados semelhante. Como você compararia os dois sem uma ferramenta quantitativa? O próximo passo certo para você, após o teste EDA e KS, é descobrir por que o teste KS está fornecendo baixo valor de p (no seu caso, pode até ser devido a algum erro).

As técnicas de EDA NÃO devem servir como ferramentas de tomada de decisão. Na verdade, eu diria que mesmo as estatísticas inferenciais são apenas exploratórias. Eles fornecem indicações sobre a direção em que sua análise estatística deve prosseguir. Por exemplo, um teste t em uma amostra forneceria apenas um nível de confiança de que a amostra pode (ou não) pertencer à população; você ainda pode prosseguir com base nesse insight sobre a qual distribuição seus dados pertencem e a que são seus parâmetros etc. De fato, quando alguns afirmam que mesmo as técnicas implementadas como parte das bibliotecas de aprendizado de máquina também são de natureza exploratória !!! Espero que eles falem sério nesse sentido ...!

Concluir decisões estatísticas com base em gráficos ou técnicas de visualização é zombar dos avanços da ciência estatística. Se você me perguntar, você deve usar esses gráficos como ferramentas para comunicar as conclusões finais com base em sua análise estatística quantitativa.

Murugesan Narayanaswamy
fonte
Isso me proíbe de fazer algo que faço com frequência e que considero sensato, tomar uma decisão com base em um enredo exploratório e parar antes de um teste de significância mais formal. Não há zombaria. Este é um comentário repetitivo e dogmático que não adiciona nada útil às excelentes respostas existentes e muito mais sutis. É muito fácil comparar parcelas QQ ...
Nick Cox
Não li outras respostas, mas se elas também incentivam métodos quantitativos, estou bem. Para a pergunta, eu havia dado minha resposta. Mas, estou curioso, não leva muito tempo para realizar testes quantitativos formais (apenas mais alguns minutos para fazer o teste KS) com pacotes agora disponíveis como o R, então por que alguém iria parar nas parcelas da EDA? Logo após validar os resultados do teste KS do R com o bootstrap, notei em vários locais onde foi mencionado como não preferível usar etc. É devido a uma suspeita geral sobre os métodos estatísticos tradicionais? Esta é a razão por trás da minha forte comments..not ofender nenhum
Murugesan Narayanaswamy
Você realmente deve ler outras respostas antes de postar. A implicação da postagem é que você tem algo diferente (e defensável) a dizer. Seu comentário é intrigante ao sugerir que gráficos QQ não são "métodos quantitativos". Um gráfico QQ mostra, em princípio, todas as informações quantitativas relevantes na avaliação do ajuste da distribuição. Por outro lado, um teste como Kolmogorov-Smirnov oferece uma redução unidimensional e ajuda pouco no que fazer em seguida.
Nick Cox
O gráfico QQ compara a distribuição teórica com os dados de teste fornecidos e fornece uma representação visual, mas o teste KS faz a mesma coisa de maneira muito mais rigorosa usando conceitos estatísticos e, finalmente, fornece um valor de probabilidade. Você não pode comparar dois gráficos de QQ, mas obterá uma diferença quantitativa ao usar o teste KS. É incorreto que o valor p do teste KS esteja errado. Também é errado que o conjunto de dados empíricos não possa ser usado para extrair parâmetros de distribuição. Eu pessoalmente fiz o bootstrap e verifiquei com os valores de p com as duas tabelas e a distribuição kolomogrov calculada manualmente.
Murugesan Narayanaswamy
Há muita sombra no seu comentário: quem está argumentando onde você não pode usar dados empíricos para obter estimativas de parâmetros? É isso que todos devemos concordar que está sendo feito aqui. Você terá que me perdoar por não querer iniciar uma discussão. Eu mantenho minha reação à sua resposta.
Nick Cox