Estou tentando quantificar o grau de inflação (ou seja, qual a melhor forma de os pontos de dados observados se ajustarem ao esperado). Uma maneira é também olhar para o enredo QQ. Mas eu gostaria de calcular algum indicador numérico para inflação - significa que quão bem o observado se encaixa na distribuição uniforme teórica.
Dados de exemplo:
# random uniform distribution
pvalue <- runif(100, min=0, max=1)
# with inflation expected i.e. not uniform distribution
pvalue1 <- rnorm(100, mean = 0.5, sd=0.1)
probability
distributions
qq-plot
rdorlearn
fonte
fonte
Respostas:
Existem diferentes maneiras de testar o desvio de qualquer distribuição (uniforme no seu caso):
1) Ensaios não paramétricos:
Você pode usar os testes Kolmogorov-Smirnov para ver a distribuição do valor observado ajustado ao esperado.
R tem
ks.test
função que pode executar o teste de Kolmogorov-Smirnov.(2) Teste de qualidade de ajuste do qui-quadrado
Nesse caso, categorizamos os dados. Observamos as frequências observadas e esperadas em cada célula ou categoria. Para o caso contínuo, os dados podem ser categorizados criando intervalos artificiais (caixas).
(3) Lambda
Se você estiver fazendo um estudo de associação ampla do genoma (GWAS), poderá calcular o fator de inflação genômica , também conhecido como lambda (λ) (também veja ). Esta estatística é popular na comunidade de genética estatística. Por definição, λ é definido como a mediana das estatísticas do teste qui-quadrado resultante dividida pela mediana esperada da distribuição qui-quadrado. A mediana de uma distribuição qui-quadrado com um grau de liberdade é 0,4549364. Um valor λ pode ser calculado a partir de escores z, estatísticas de qui-quadrado ou valores de p, dependendo da saída que você possui da análise de associação. Em algum momento, a proporção do valor-p da cauda superior é descartada.
Para valores-p, você pode fazer isso:
Se os resultados da análise, seus dados seguem a distribuição qui-quadrado normal (sem inflação), o valor λ esperado é 1. Se o valor λ for maior que 1, isso pode ser uma evidência de algum viés sistemático que precisa ser corrigido em sua análise. .
O Lambda também pode ser estimado usando a análise de regressão.
Outro método para calcular lambda está usando 'KS' (otimizando o ajuste da distribuição chi2.1df usando o teste de Kolmogorov-Smirnov).
fonte