Teste de hipótese de Poisson para dois parâmetros

9

Então, por diversão, estou pegando alguns dados das chamadas do call center em que trabalho e tentando fazer alguns testes de hipóteses, especificamente o número de chamadas recebidas em uma semana, e usando uma distribuição Poisson para ajustá-las. Devido ao assunto do meu trabalho, existem dois tipos de semanas, vamos chamá-lo em uma semana em que eu suponho que haja mais ligações e fora de semanas em que eu suponho que há menos.

Eu tenho uma teoria de que o de uma semana (vamos chamá-lo ) é maior do que o de um fora de semana (vamos chamá-lo ) $\lambda$ $\lambda_1$ $\lambda_2$

Portanto, a hipótese que eu quero testar é $H_0: \lambda_1 > \lambda_2, H_1: \lambda_1 \leq \lambda_2$

Eu sei como testar um parâmetro (digamos ), mas não tenho tanta certeza de como proceder para fazer 2 com um conjunto de dados. Digamos que eu tomo o valor de duas semanas de dados de cada um e para a semana e e para a semana. Alguém pode me ajudar nessa versão mais simples, para que eu possa aplicá-la a um conjunto de dados maior? Qualquer ajuda é apreciada, obrigado. $H_0: \lambda_1 > 1, H_1: \lambda_1 \leq 1$ $X_1 = 2$ $X_2 = 3$ $Y_1 = 2$ $Y_2=6$

hypothesis-testing poisson-distribution James Snyder
fonte

3

As chamadas são realmente distribuídas? Se houver muitas chamadas, é melhor modelá-las como aproximadamente normais. Mas isso pode matar a diversão.

RegressForward

11

Bem, o que determina que é assim que você o enquadra? Estou recebendo x número de chamadas discretas em qualquer período de tempo da unidade. Eu poderia fazê-lo como uma distribuição normal com certeza, mas o ponto principal é que eu gostaria de tentar com Poisson, uma vez que se encaixa.

James Snyder

Se você presumir que as contagens são Poisson, basta adicionar as contagens (me corrija se eu estiver errado). Ou seja, você obteria X = 2 + 3 e Y = 2 + 6. Você pode testar a diferença usando, por exemplo, o'poisson.test 'em R. Se você quiser fazer uma análise bayesiana, também tenho um post sobre isso aqui: sumsar.net/blog/2014/ 09 / bayesian-first-aid-poisson-test

Rasmus Bååth

4

Observe que normalmente a igualdade é nula (por um bom motivo).

Essa questão à parte, vou mencionar algumas abordagens para um teste desse tipo de hipótese

Um teste muito simples: condição na contagem total observada , que a converte em um teste binomial de proporções. Imagine que não são sobre-semana e off-semana e semanas combinadas. $n$ $w_\text{on}$ $w_\text{off}$ $w$

Em seguida, sob a hipótese nula, a proporção esperada é e $\frac{w_\text{on}}{w}$ respectivamente. Você pode fazer um teste unilateral da proporção nas semanas semanais com bastante facilidade. $\frac{w_\text{off}}{w}$

Você pode construir um teste unilateral adaptando uma estatística relacionada a um teste de razão de verossimilhança; a forma z do teste de Wald ou de um teste de pontuação pode ser executada por uma cauda, por exemplo, e deve funcionar bem para . $\lambda$

Existem outras opiniões sobre isso.

Glen_b -Reinstate Monica
fonte

1

Que tal apenas usar o GLM com estrutura de erro de Poisson e log-link ??? Mas a idéia sobre binômio pode ser mais poderosa.

Ivan Kshnyasev
fonte

No momento, isso é mais um comentário do que uma resposta. Você pretendeu isso como um comentário, uma pergunta para esclarecimento ou uma resposta? Neste último caso, você pode expandi-lo para mais respostas? Também podemos convertê-lo em um comentário para você.

gung - Restabelece Monica

1

Eu resolveria isso com um GLM de Poisson ou Quasi-Poisson com uma preferência por um binômio quase-Poisson ou negativo.

O problema com o uso de Poisson tradicional é que ele requer que a variação e a média sejam iguais, o que provavelmente não é o caso. O quase-Poisson ou NB estima a variação irrestrita pela média.

Você pode fazer qualquer um desses itens no R com muita facilidade.

# week on = 1, week off = 0
week.status <- c(1, 1, 0, 0)
calls <- c(2, 6, 2, 3)
model <- glm(calls ~ week.status, family = poisson())
# or change the poisson() after family to quasipoisson() 
# or use the neg binomial glm from the MASS package

A abordagem GLM é benéfica e, como você pode expandir, inclui variáveis adicionais (por exemplo, mês do ano) que podem afetar o volume de chamadas.

Para fazer isso manualmente, eu provavelmente usaria uma aproximação normal e um teste t de duas amostras.

iacobus
fonte

1

Começamos com o parâmetro Estimativa máxima de verossimilhança para o parâmetro Poisson, que é médio.

$\hat\lambda_1=\bar Y~~and~~\hat\lambda_2=\bar X$

$\bar Y-\bar X\sim N(\lambda_1-\lambda_2,\frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2})$

$\frac{(\bar Y-\bar X)-\lambda_1-\lambda_2}{\sqrt{\frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2}}}$

$Z<Critical~Value$

Hemant Rupani
fonte

0

A partir da página 125 da hipótese estatística de testes da Casella, é apresentada a resposta ao tipo de pergunta que você formulou. Anexei um link a um pdf que encontrei on-line para sua referência. Hipótese estatística de teste de Casella, terceira edição .

Nuzhi Meyen
fonte

Bom ponteiro, no entanto, as respostas apenas ao link são desencorajadas no Cross Validated. Você poderia esboçar a resolução na sua resposta? Obrigado.

Xian

Desculpe, eu não conhecia essa regra. Obrigado por me informar. :) Tentará dar uma resposta abrangente o mais rápido possível.

Nuzhi Meyen

Teste de hipótese de Poisson para dois parâmetros

Respostas: