Relação entre Poisson, distribuições binomiais, binomiais negativas e distribuição normal

7

Quando precisamos definir distribuições de contagens discretas, geralmente usamos:

  • Distribuição de Poisson, se média = variância
  • Distribuição binomial, se média> variância
  • Distribuição binomial negativa, se média <variância

Minha pergunta é: é possível usar a distribuição normal para aproximar? Por exemplo, para ter uma distribuição de Poisson (com média = 4), começamos com uma distribuição normal (com média = variância = 4)

x=seq(0,20,1)
plot(x,dpois(x,4))
points(x,dnorm(x,4,2),col=2)

Podemos ver que as duas densidades não são muito diferentes. Agora, se definirmos limites e algumas regras:

  • se o resultado da lei normal for negativo, será 0
  • para x = 6,2, são 6, etc.

É possível usar essa aproximação da distribuição normal para definir completamente uma distribuição de Poisson? A mesma coisa para binomial negativo e binomial.

Por que eu tento fazer isso? Normalmente, quando tentamos definir uma distribuição de Poisson com dados da vida real, nunca temos média = variância. Então, quando usamos uma distribuição de Poisson, é porque temos aproximadamente essa condição. Temos que discutir esses três casos, com média e variância estimadas (a partir de dados da vida real).

Então, minha ideia é sempre usar

  • a média empírica e variância, para definir uma distribuição normal
  • então, defina algumas "regras" em função desses parâmetros
  • para calcularmos a média e a variação nos dados simulados de contagem discreta, podemos verificar a média e a variação empíricas iniciais.

O que você acha desse método, quando se trata de simular dados de contagem discretos, em vez de usar distribuição de Poisson, binomial ou binomial negativa?

Xiaoshi
fonte

Respostas:

9
  • A distribuição binomial é a distribuição do número de sucessos em um número fixo (ou seja, não aleatório) de tentativas independentes, com a mesma probabilidade de sucesso em cada tentativa. É suporte é o conjunto{0,1,2,,n}, que é finito, onde n é o número de tentativas.

  • A distribuição binomial negativa é a distribuição do número de falhas antes de um número fixo (ou seja, não aleatório) de sucessos, novamente com tentativas independentes e a mesma probabilidade de sucesso em cada tentativa. Seu suporte é o conjunto{0,1,2,3,}, que é infinito.

  • A distribuição de Poisson pode ser fracamente caracterizada como o número de sucessos em um número infinito de tentativas independentes, com uma probabilidade infinita de sucesso em cada tentativa, na qual o número esperado de sucessos é um número positivo fixo. É um limite da distribuição binomial na qual o número de tentativas se aproxima e a probabilidade de sucesso em cada tentativa de abordagem 0 de tal maneira que o número esperado de sucessos permaneça constante ou, pelo menos, se aproxime de algum número positivo.

É verdade que para a distribuição binomial a média é maior que a variância, para a distribuição binomial negativa a média é menor que a variância e, para a distribuição de Poisson, são iguais.

Mas é não verdade que para cada distribuição cujo suporte é um conjunto de números cardinais, se a média é igual à variância, então é uma distribuição de Poisson, nem que, se a média é maior do que a variância é uma distribuição binomial, nem que, se a média é menor que a variância; é uma distribuição binomial negativa. Por exemplo, a média da distribuição hipergeométrica que surge da amostragem sem substituição é maior que a variância, assim como a distribuição binomial, mas a distribuição não é a mesma. Para a distribuição uniforme no aparelho{0,1,2,,n}, E se n>4então a variação é maior que a média, como na distribuição binomial negativa, mas a distribuição não é a mesma. Para a distribuição uniforme no aparelho{0,2}, a variação é igual à média, como na distribuição de Poisson, mas a distribuição não é a mesma.

E se XPoisson(λ) então

XλλD.N(0,1) as λ
porque quando λ é grande, a distribuição de X é o mesmo que a distribuição da soma de um grande número de variáveis ​​aleatórias distribuídas de Poisson cuja soma é próxima 1. Isso ocorre porque a soma das variáveis ​​aleatórias distribuídas por Poisson independentes é distribuída por Poisson, de modo que o teorema do limite central pode ser aplicado.

E se XBinomial(n,p) então

Xnpnp(1p)D.N(0,1) as n
Porque X tem a mesma distribuição que a soma de n variáveis ​​aleatórias independentes distribuídas como Binomial(1,p), então novamente o teorema do limite central se aplica.

A distribuição binomial negativa com parâmetros r,p é a distribuição do número de falhas antes da rsucesso, com probabilidade pde sucesso em cada tentativa. E seX é tão distribuído, então temos

X(pr/(1p))pr/(1p)D.N(0,1) as r
Porque X tem a mesma distribuição que a soma de r variáveis ​​aleatórias independentes distribuídas como binomial negativo com parâmetros 1,p, então novamente o teorema do limite central se aplica.

Ao aproximar qualquer um desses tipos de distribuição com uma distribuição normal, observe que o [Xn] é o mesmo que o evento [X<n+1], use a correção de continuidade na qual você encontra a probabilidade de [Xn+12] de acordo com a distribuição normal.

Michael Hardy
fonte