Aqui na Wikipedia diz:
Para valores suficientemente grandes de , (digamos ), a distribuição normal com média e variância (desvio padrão ) é uma excelente aproximação à distribuição de Poisson. Se for maior que cerca de 10, a distribuição normal será uma boa aproximação se uma correção de continuidade apropriada for realizada, ou seja, onde (em minúsculas) é um número inteiro não negativo, é substituído por
Infelizmente isso não é citado. Eu quero ser capaz de mostrar / provar isso com algum rigor. Como você pode realmente dizer que a distribuição normal é uma boa aproximação quando , como você quantifica essa aproximação 'excelente', que medidas foram usadas?
O mais longe que eu consegui disso é aqui, onde John fala sobre o uso do teorema de Berry – Esseen e aproxima o erro nos dois CDFs. Pelo que posso ver, ele não tenta nenhum valor de .
Respostas:
Suponha que seja Poisson com o parâmetro e seja normal com média e variância . Parece-me que a comparação apropriada é entre e . Aqui, por simplicidade, escrevo , ou seja, estamos interessados quando corresponde a desvios padrão da média.X λ Y λ Pr(X=n) Pr(Y∈[n−12,n+12]) n=λ+αλ−−√ n α
Então eu traí. Eu usei o Mathematica. Portanto, e são assintóticos a como . Mas a diferença deles é assintótica para Se Se você plotar isso como uma função de , obterá a mesma curva mostrada na penúltima figura em http://www.johndcook.com/blog/normal_approx_to_poisson/ .Pr(X=n) Pr(Y∈[n−12,n+12])
Aqui estão os comandos que eu usei:
Além disso, com um pouco de experimentação, parece-me que uma melhor aproximação assintótica de é . Então o erro é que é aproximadamente vezes menor.Pr(X=n) Pr(Y∈[n−α2/6,n+1−α2/6])
fonte
Glen_b está correto, pois "bom ajuste" é uma noção muito subjetiva. No entanto, se você deseja verificar se sua distribuição de poisson é razoavelmente normal, você pode usar um teste hipotético de Kolmorgov-Smirnov com a hipótese nula sendo O CDF veio de uma distribuição , assumindo sua amostra virá de um poisson ( ). Como você não está realmente testando uma amostra, mas uma distribuição contra outra, é necessário pensar cuidadosamente sobre o tamanho da amostra e o nível de significância assumido para esse teste hipotético (uma vez que não estamos usando o teste KS da maneira típica). Isso é:H0: N(λ,λ) λ
Agora, calcule a taxa de erro do Tipo II para este teste, assumindo que seus dados realmente provêm de um poisson ( ). Seu grau de adequação a uma distribuição normal será essa taxa de erro do Tipo II, no sentido de que amostras de tamanho n de sua distribuição de poisson específica serão, em média, aceitas % do tempo por um teste de normalidade KS no seu país selecionado. nível de significância.λ β
Enfim, essa é apenas uma maneira de obter uma sensação de "qualidade do ajuste". No entanto, todos confiam em algumas noções subjetivas de "bondade" que você terá que definir por si mesmo.
fonte
A derivação da distribuição binomial pode lhe dar algumas dicas.
Temos uma variável aleatória binomial;
Como alternativa, isso pode ser computado recursivamente;
Se você mantiver a condição inicial;
Agora vamos assumir que é grande é pequeno, mas o sucesso médio de é constante . Então podemos fazer o seguinte;n p p(x) (np=λ)
Usamos esse .p=λ/n
Nós trocamos algumas variáveis e avaliamos;
Do cálculo, sabemos que . Também sabemos que porque tanto a parte superior quanto a inferior são polinômios de grau .limn→∞(1+x/n)n=ex [n(n−1)(n−2)⋯(n−i+1)]/ni≈1 i
Isso leva à conclusão de que, como :n→∞
Você pode verificar se e através da definição. Sabemos que a distribuição binomial se aproxima do normal nas condições do Teorema de De Moivre-Laplace , desde que você corrija a continuidade, razão pela qual é substituído por .E(X)=λ Var(X)=λ P(X≤x) P(X≤x+0.5)
fonte