Verificando se duas amostras de Poisson têm a mesma média

30

Esta é uma pergunta elementar, mas não consegui encontrar a resposta. Eu tenho duas medidas: n1 eventos no tempo t1 e n2 eventos no tempo t2, ambos produzidos (digamos) por processos de Poisson com valores lambda possivelmente diferentes.

Na verdade, isso é de um artigo de notícias, que afirma essencialmente que, desde os dois são diferentes, mas não tenho certeza de que a reivindicação seja válida. Suponha que os períodos não tenham sido escolhidos com intuito malicioso (para maximizar os eventos em um ou outro).n1/t1n2/t2

Posso apenas fazer um teste t ou isso não seria apropriado? O número de eventos é muito pequeno para eu chamar confortavelmente as distribuições aproximadamente normais.

Charles
fonte
11
Espécime finas de jornalismo científico, lá ...
Matt Parker
11
Sim ... você pode ver porque eu queria verificar as estatísticas usadas.
Charles

Respostas:

25

Para testar a média de Poisson, o método condicional foi proposto por Przyborowski e Wilenski (1940). A distribuição condicional de X1 dada X1 + X2 segue uma distribuição binomial cuja probabilidade de sucesso é uma função da razão dois lambda. Portanto, procedimentos de teste de hipóteses e estimativa de intervalos podem ser facilmente desenvolvidos a partir dos métodos exatos para fazer inferências sobre a probabilidade de sucesso binomial. Geralmente, dois métodos são considerados para esse fim,

  1. Teste C
  2. E-test

Você pode encontrar os detalhes sobre esses dois testes neste documento. Um teste mais poderoso para comparar duas médias de Poisson

Wazir
fonte
4
+1 Boa referência, obrigado. O teste C é uma versão mais rigorosa da que eu esbocei, portanto vale a pena considerar. O teste E relaciona uma estatística t a uma distribuição apropriada. O cálculo dessa distribuição envolve uma soma infinita dupla que levará os cálculos de a convergir: bastante fácil de codificar, provavelmente um exagero para verificar o jornal! O(n1n2)
whuber
11
O autor do artigo de teste E escreveu uma implementação simples do fortran para calcular valores-p para duas médias de poisson aqui: ucs.louisiana.edu/~kxk4695 Eu levei o fortran para o MATLAB aqui git.io/vNP86
AndyL
11

E se:

poisson.test(c(n1, n2), c(t1, t2), alternative = c("two.sided"))

Este é um teste que compara as taxas de Poisson de 1 e 2 e fornece um valor de p e um intervalo de confiança de 95%.

Rob van Gemert
fonte
Deve-se notar que, para um problema de duas amostras, isso usa um teste binomial para comparar taxas
Jon
10

Você está procurando uma verificação rápida e fácil.

λt=t1 1+t2[0 0,t1 1]n1 1[t1 1,t1 1+t2]n2

λ^=n1 1+n2t1 1+t2

nEutEuλ^nEu

whuber
fonte
11
Obrigado (+1), é a verificação certa para esse tipo de coisa inusitada. Acabou sendo altamente significativo (p = 0,005), portanto o artigo está correto. Espero que você não se importe, porém, de ter aceito a outra resposta - é bom saber a maneira 'real' de fazê-lo quando for necessário.
Charles
5

Eu estaria mais interessado em um intervalo de confiança do que um valor ap, aqui está uma aproximação de autoinicialização.

Calculando primeiro os comprimentos dos intervalos e uma verificação:

Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)

[1] 2.000276

Essa verificação fornece um resultado ligeiramente diferente (aumento de 100,03%) do que o da publicação (aumento de 101%). Continue com o bootstrap (faça duas vezes):

N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660 

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706 

O intervalo de confiança de 95% do aumento é de 31% a 202%.

GaBorgulya
fonte