Aproximando

11

Qual é a melhor maneira de aproximar para dois inteiros dados quando você conhece a média , variação , e excesso de curtose de uma distribuição discreta e fica claro pelas medidas (diferentes de zero) da forma e que uma aproximação normal não é apropriada?m , n u σ 2 γ 1 γ 2 X γ 1 γ 2Pr[nXm]m,nμσ2γ1γ2Xγ1γ2

Normalmente, eu usaria uma aproximação normal com correção de número inteiro ...

Pr[(n½)X(m+½)]=Pr[(n-½)-μσZ(m+½)-μσ]=Φ((m+½)-μσ)-Φ((n-½)-μσ)

... se a assimetria e o excesso de curtose forem (mais próximos) de 0, mas não é o caso aqui.

Eu tenho que executar várias aproximações para diferentes distribuições discretas com valores diferentes de e . Portanto, estou interessado em descobrir se existe um procedimento estabelecido que use e para selecionar uma aproximação melhor do que a aproximação normal.γ1γ2γ1γ2

kjetil b halvorsen
fonte

Respostas:

4

Esta é uma pergunta interessante, que realmente não tem uma boa solução. Existem algumas maneiras diferentes de lidar com esse problema.

  1. Assuma uma distribuição subjacente e combine momentos - conforme sugerido nas respostas de @ivant e @onestop. Uma desvantagem é que a generalização multivariada pode não ser clara.

  2. Aproximações do ponto de sela. Nesse papel:

    Gillespie, CS e Renshaw, E. Uma aproximação melhorada do ponto de sela. Biociências Matemáticas , 2007.

    Nós olhamos para recuperar um pdf / pmf quando temos apenas os primeiros momentos. Descobrimos que essa abordagem funciona quando a assimetria não é muito grande.

  3. Expansões de Laguerre:

    Mustapha, H. e Dimitrakopoulosa, R. Expansões generalizadas de Laguerre de densidades de probabilidade multivariadas com momentos . Computadores e Matemática com Aplicações , 2010.

    Os resultados deste artigo parecem mais promissores, mas não os codifiquei.

csgillespie
fonte
4

Ajustar uma distribuição aos dados usando os quatro primeiros momentos é exatamente para o que Karl Pearson planejou a família Pearson de distribuições de probabilidade contínuas (a probabilidade máxima é muito mais popular atualmente). Deve ser simples de ajustar-se ao membro relevante dessa família, em seguida, use o mesmo tipo de correção de continuidade que você fornece acima para a distribuição normal.

Presumo que você deve ter um tamanho de amostra verdadeiramente enorme? Caso contrário, as estimativas amostrais de assimetria e especialmente kurtosis são muitas vezes irremediavelmente impreciso, bem como sendo altamente sensível a outliers.In qualquer caso, eu recomendo que você dê uma olhada no G-momentos como uma alternativa que têm várias vantagens sobre os momentos comuns que podem ser vantajoso para ajustar distribuições aos dados.

uma parada
fonte
2

Você pode tentar usar a distribuição normal de inclinação e ver se a curtose excessiva para seus conjuntos de dados específicos é suficientemente próxima da curtose excessiva da distribuição para a assimetria especificada. Se for, você pode usar o cdf da distribuição normal de inclinação para estimar a probabilidade. Caso contrário, você teria que criar uma transformação no pdf normal / assimétrico semelhante à usada para a distribuição normal assimétrica, que daria controle sobre a assimetria e o excesso de curtose.

Ivan Tarasov
fonte