Qual é a diferença entre a distribuição binomial negativa e a distribuição binomial?
Tentei ler on-line e descobri que a distribuição binomial negativa é usada quando os pontos de dados são discretos, mas acho que até a distribuição binomial pode ser usada para pontos de dados discretos.
Respostas:
A diferença é a que nos interessa. Ambas as distribuições são construídas a partir de ensaios independentes de Bernoulli com probabilidade fixa de sucesso, p .
Com a distribuição binomial, a variável aleatória X é o número de sucessos observados em n ensaios. Como existe um número fixo de tentativas, os possíveis valores de X são 0, 1, ..., n .
Com a distribuição Binomial Negativa, a variável aleatória Y é o número de tentativas até observar o r- ésimo sucesso. Nesse caso, continuamos aumentando o número de tentativas até alcançar r sucessos. Os possíveis valores de Y são r , r + 1 , r + 2 , ... sem limite superior. O Negative Binomial também pode ser definida em termos de número de falhas até o r th sucesso, em vez do número de ensaios até o r th sucesso. A Wikipedia define a distribuição binomial negativa dessa maneira.
Então, para resumir:
Binomial :
Binomial negativo :
Agradeço a Ben Bolker por me lembrar de mencionar o apoio das duas distribuições. Ele respondeu a uma pergunta relacionada aqui .
fonte
A distribuição binomial negativa, apesar da aparente relação óbvia com o binomial, é realmente melhor comparada à distribuição de Poisson. Todos os três são discretos.
Em aplicações práticas, o NB é uma alternativa ao Poisson quando você observa a dispersão (variação) maior que o esperado por Poisson. Poisson é a primeira escolha a considerar quando você lida com dados de contagem, por exemplo, um número anual de mortes em acidentes de carro em uma cidade pequena. A média e a variância da distribuição de Poisson são definidas por um parâmetro - uma taxa de ocorrência, geralmente denotada como . Enquanto você estimar , sua média e variância seguem. De fato, a média deve ser igual à variância.λ λ
Se seus dados sugerem que a variação é maior que a média (super-dispersão), isso exclui Poisson, o binômio negativo seria a próxima distribuição a ser observada. Ele possui mais de um parâmetro, portanto, sua variação pode ser maior que a média.
A relação do RN com o binômio vem do processo subjacente, conforme descrito na resposta de @ Jelsema. O processo está relacionado, assim como as distribuições também, mas como expliquei aqui, o link para a distribuição de Poisson é mais próximo em aplicações práticas.
UPDATE: Outro aspecto é a parametrização. A distribuição binomial possui dois parâmetros: p e n. Seu domínio de boa-fé é de 0 a n. Nisto não é apenas discreto, mas também definido em um conjunto finito de números.
Por outro lado, Poisson e NB são definidos em um conjunto infinito de números inteiros não negativos. Poisson possui um parâmetro , enquanto NB possui dois: pe er. Observe que esses dois não têm o parâmetro . Portanto, é mais uma maneira de ver como o NB e o Poisson estão conectados.λ n
fonte
Ambos são discretos e representam contagens quando você está amostrando.
fonte