Eu tenho uma amostra de dados que foram gerados a partir de uma variável aleatória contínua X. E a partir do histograma que eu desenho usando R, acho que talvez a distribuição de X obedeça a uma determinada distribuição gama. Mas não conheço os parâmetros exatos dessa distribuição gama.
Minha pergunta é como testar se a distribuição de X pertence a uma família de distribuição Gamma? Existem alguns testes de ajuste de qualidade, como o teste de Kolmogorov-Smirnov, o teste de Anderson-Darling e assim por diante, mas uma das restrições ao usar esses testes é que os parâmetros da distribuição teórica devem ser conhecidos antecipadamente. Alguém poderia me dizer como resolver este problema?
Respostas:
Eu acho que a pergunta pede um teste estatístico preciso, não uma comparação de histograma. Ao usar o teste Kolmogorov-Smirnov com parâmetros estimados , a distribuição das estatísticas de teste abaixo de nulo depende da distribuição testada, ao contrário do caso sem parâmetro estimado. Por exemplo, usando (em R)
leva a
enquanto chegamos
para a mesma amostra x. O nível de significância ou o valor p, portanto, deve ser determinado pela simulação de Monte Carlo sob o nulo, produzindo a distribuição das estatísticas Kolmogorov-Smirnov a partir de amostras simuladas sob a distribuição estimada (com uma ligeira aproximação no resultado, dado que a amostra observada vem de outra distribuição, mesmo sob o nulo).
fonte
Calcule MLEs dos parâmetros assumindo uma distribuição gama para seus dados e compare a densidade teórica com o histograma de seus dados. Se os dois forem muito diferentes, a distribuição gama é uma fraca aproximação dos seus dados. Para um teste formal, você pode calcular, por exemplo, a estatística do teste Kolmogorov-Smirnoff, comparando a distribuição gama mais adequada com a distribuição empírica e o teste de significância.
fonte