Por que a correção de continuidade (por exemplo, a aproximação normal à distribuição binomial) funciona?

24

Desejo entender melhor como foi derivada a correção da continuidade da distribuição binomial para a aproximação normal.

Que método foi usado para decidir que devemos adicionar 1/2 (por que não outro número?). Qualquer explicação (ou um link para a leitura sugerida, além desta , seria apreciada).

Tal Galili
fonte

Respostas:

29
  1. De fato, nem sempre "funciona" (no sentido de sempre melhorar a aproximação do binômio cdf pelo normal em qualquer x ). Se o binômio p for 0,5, acho que sempre ajuda, exceto, talvez, pela cauda mais extrema. Se p não estiver muito longe de 0,5, para razoavelmente grande n, geralmente funciona muito bem, exceto na extremidade mais distante, mas se p estiver próximo de 0 ou 1, pode não ajudar em nada (consulte o ponto 6. abaixo)

  2. Uma coisa a ter em mente (apesar das ilustrações quase sempre envolvendo pmfs e pdfs) é que estamos tentando aproximar o cdf. Pode ser útil refletir sobre o que está acontecendo com o cdf do binômio e o normal aproximado (por exemplo, aqui está n=20,p=0.5 ):

    insira a descrição da imagem aqui

    No limite, o cdf de um binômio padronizado irá para um normal padrão (observe que a padronização afeta a escala no eixo x, mas não no eixo y); ao longo do caminho de cada vez maior n saltos do CDF binomial tendem a escarranchar mais uniformemente a CDF normal.

    Vamos aumentar o zoom e ver isso no exemplo simples acima:

    insira a descrição da imagem aqui

    Observe que, como a aproximação normal passa perto do meio dos saltos verticais *, enquanto no limite, o cdf normal é localmente aproximadamente linear e (como é a progressão do cdf binomial no topo de cada salto); como resultado, o cdf tende a cruzar as etapas horizontais próximas a . Se você deseja aproximar o valor do cdf binomial,F(x)no número inteirox, o cdf normal atinge essa altura perto dex+1x+12F(x)x .x+12

    * Se aplicarmos Berry-Esseen a variáveis ​​Bernoulli corrigidas pela média, os limites de Berry-Esseen permitirão muito pouco espaço de manobra quando estiver próximo de 1p exestão próximos deμ- o cdf normal deve passar razoavelmente perto do meio dos saltos, porque, caso contrário, a diferença absoluta nos cdfs excederá o melhor limite de Berry-Essen de um lado ou de outro. Por sua vez, isso está relacionado à distância dex+112xμ o cdf normal pode cruzar parte horizontal da função de etapa do binômio cdf.x+12

  3. Expandindo a motivação que em 1. vamos considerar como usaríamos uma aproximação normal ao binômio cdf para calcular . Por exemplo, n = 20 , p = 0,5 , k = 9 (veja o segundo diagrama acima). Portanto, nosso normal com a mesma média e sd é N ( 10 , ( P(X=k)n=20,p=0.5,k=9. Observe que aproximamos o salto em cdf em 9 pela alteração no cdf normal entre 8,5 e 9,5.N(10,(5)2)

insira a descrição da imagem aqui

  1. p(x)xp(x)

    ! [insira a descrição da imagem aqui

    x12x+1212

    Pode-se motivar essa abordagem algebricamente usando uma derivação [ao longo das linhas de De Moivre - veja aqui ou aqui, por exemplo] para derivar a aproximação normal (embora possa ser realizada de maneira um pouco mais direta que a abordagem de De Moivre).

    (nx)log(1+x)xx2/2

    P(X=x)12πnp(1p)exp((xnp)22np(1p))

    μ=npσ2=np(1p)xx

    YN(np,np(1p))F(y+12)F(y12)=y12y+12fY(u)dufY(y)fY(x)P(X=x)P(X=x)F(x+12)F(x12)

    [Uma aproximação semelhante do tipo "regra do ponto médio" pode ser usada para motivar outras aproximações de pmfs contínuos por densidades usando uma correção de continuidade, mas é preciso sempre ter cuidado ao prestar atenção em onde faz sentido invocar essa aproximação]

  2. Nota histórica: a correção da continuidade parece ter se originado com Augustus de Morgan em 1838 como uma melhoria da aproximação de De Moivre. Veja, por exemplo, Hald (2007) [1]. A partir da descrição de Hald, seu raciocínio seguiu as linhas do item 4. acima (isto é, essencialmente em termos de tentativa de aproximar o pmf, substituindo o pico de probabilidade por um "bloco" de largura 1 centrado no valor x).

  3. Uma ilustração de uma situação em que a correção da continuidade não ajuda:

    insira a descrição da imagem aqui

    XYFX(x)FY(x+12)p(x)FY(x+12)FY(x12)FX(x)FY(x)p(x)FY(x)FY(x1)

    [1]: Hald, Anders (2007),
    "Uma História de Inferência Estatística Paramétrica de Bernoulli a Fisher, 1713-1935",
    Fontes e Estudos em História da Matemática e Ciências Físicas,
    Springer-Verlag New York

Glen_b -Reinstate Monica
fonte
1

Acredito que o fator decorra do fato de estarmos comparando uma distribuição contínua a uma discreta. Portanto, precisamos traduzir o que cada valor discreto significa na distribuição contínua. Poderíamos escolher outro valor, no entanto, isso seria desequilibrado em relação a um determinado número inteiro. (ou seja, você ponderaria a probabilidade de ficar em 6 a mais em relação a 7 que em 5.)

Encontrei um link útil aqui: link

Kitter Catter
fonte