Qual é a aproximação normal da distribuição multinomial?

Respostas:

21

Você pode aproximar isso com a distribuição normal multivariada da mesma maneira que a distribuição binomial é aproximada pela distribuição normal univariada. Verifique os elementos da teoria da distribuição e da distribuição multinomial, páginas 15-16-17.

Let P=(p1,...,pk) ser o vector de suas probabilidades. Em seguida, o vector médio da distribuição normal multivariada é np=(np1,np2,...,npk) . A matriz de covariância é um k×k simétrica matriz. Os elementos diagonais são, na verdade, a variação de Xi 's; ie , i = 1 , 2 ... , k . O elemento fora da diagonal na i-ésima linha e j-ésima coluna é Cov ( X i , X j ) = - n p i p j , onde i não é igual a j .npEu(1 1-pEu)Eu=1 1,2 ...,kCov(XEu,Xj)=-npEupjEuj

Estado
fonte
11
Confira a segunda referência.
Stat
3
Stat, para que esta resposta possa permanecer por si só (e ser resistente à podridão do link), você se importaria em fornecer um resumo da solução?
whuber
4
Isso precisa de uma correção de continuidade? Como você aplicaria isso?
Jack Aidley 23/05
2
A matriz de covariância não é definida positivamente, mas sim semi-definida positiva, e não é de classificação completa. Isso torna indefinida a distribuição multinormal resultante. Esse é o problema que eu enfrentei. Alguma idéia de como lidar com isso?
Mohammad Alaggan 13/09/16
2
@ M.Alaggan: As matrizes de média / covariância definidas aqui têm um pequeno problema: para uma distribuição multinomial com variáveis , o normal multivariado equivalente tem variáveis k - 1 . Isso é evidente no exemplo binomial simples, que é aproximado pela distribuição normal (comum). Para uma discussão mais aprofundada, consulte o Exemplo 12.7 dos Elementos da Teoria da Distribuição . kk-1 1
MS Dousti 21/07
1

A densidade dada nesta resposta é degenerada e, portanto, usei o seguinte para calcular a densidade resultante da aproximação normal:

Há um teorema que diz dada uma variável aleatória X=[X1 1,,Xm]TMultinom(n,p) , para um m -dimensional vector p com EupEu=1 1 e EuXEu=n , que;

Xdndiag(você)Q[Z1 1Zm-1 10 0]+[np1 1npm],

para n grande , dado;

  • um vetor você com vocêEu=pEu ;
  • aleatória variáveis ZEuN(0 0,1 1) para Eu=1 1,,m-1 1 , e;
  • uma matriz ortogonal Q com a coluna final você .

Ou seja, com alguns rearranjos, podemos calcular uma distribuição normal multivariada m-1 1 dimensional para os primeiros componentes m-1 1 de X (que são os únicos componentes interessantes porque Xm é a soma dos outros).

Um valor adequado da matriz Q é Eu-2vvT com vEu=(δEum-vocêEu)/2(1 1-vocêm) - ou seja, uma transformação particular do Proprietário.

Se restringirmos o lado esquerdo para o primeiro m-1 1 linhas, e restringir Q ao seu primeiro m-1 1 linhas e m-1 1 colunas (denotar estas X e Q , respectivamente) em seguida:X^Q^

X^dndiag(você^)Q^[Z1 1Zm-1 1]+[np1 1npm-1 1]N(μ,nΣ),

para n grande , onde;

  • você^ indica o primeirom-1 1termos devocê;
  • a média é μ=[np1 1,,npm-1 1]T , e;
  • a matriz de covariância nΣ=nUMAUMAT com UMA=diag(você^)Q^ .

O lado direito dessa equação final é a densidade não degenerada usada no cálculo.

Como esperado, quando você conecta tudo, obtém a seguinte matriz de covariância:

(nΣ)Euj=npEupj(δEuj-pEupj)

para Eu,j=1 1,,m-1 1 , que é exatamente a matriz de covariância na resposta original restrita às suas primeiras m-1 1 linhas e m-1 1 colunas.

Esta entrada do blog foi o meu ponto de partida.

stephematician
fonte
11
Outro recurso útil são os links fornecidos em: stats.stackexchange.com/questions/2397/…
stephematician
11
Boa resposta (+1) --- Observe que você pode incorporar links com a sintaxe [textual description](hyperlink). Tomei a liberdade de editar esta resposta para incorporar seus links.
Ben - Restabelece Monica