Estou procurando alguns bons exemplos de situações inadequadas para modelar com uma distribuição Poisson, para me ajudar a explicar a distribuição Poisson para os alunos.
Geralmente, usa-se o número de clientes que chegam a uma loja em um intervalo de tempo como um exemplo que pode ser modelado por uma distribuição Poisson. Estou procurando um contra-exemplo em uma veia semelhante, ou seja, uma situação que possa ser considerada como um processo de contagem positiva em tempo contínuo que claramente não é Poisson.
Idealmente, a situação deve ser a mais simples e direta possível, para facilitar a compreensão e a lembrança dos alunos.
Respostas:
Número de cigarros fumados em um período de tempo: isso requer um processo de enchimento zero (por exemplo, Poisson com enchimento zero ou binômio negativo com enchimento zero), porque nem todo mundo fuma.
fonte
Você quer dizer dados de contagem positiva? Não consolidado?
O binômio negativo é popular.
Outro bom modelo é o Poisson com 0. inflado. Esse modelo assume que algo está acontecendo ou não - e, se estiver, segue um Poisson. Eu vi um exemplo recentemente. Perguntou-se aos enfermeiros que tratavam pacientes com Aids com que frequência experimentavam comportamentos estigmatizadores de outras pessoas como resultado de seu envolvimento com pacientes com Aids. Um grande número nunca teve essas experiências, possivelmente por causa de onde trabalhavam ou moravam. Dos que o fizeram, o número de experiências estigmatizantes variou. Havia mais 0s relatados do que você esperaria de um Poisson direto, basicamente porque uma certa proporção do grupo em estudo simplesmente não estava em um ambiente que os expôs a tais comportamentos.
Uma mistura de Poisson também daria um processo pontual.
fonte
Contando processos que não são Poisson? Bem, qualquer processo de espaço de amostra finito, como binomial ou uniforme discreto. Você obtém um processo de contagem de Poisson a partir da contagem de eventos com tempos intermediários independentes, que são distribuídos exponencialmente, de modo que um grande número de generalizações cai fora daquele, como os tempos intermediários distribuídos gama ou lognormal ou Weibull, ou qualquer tipo de tempo intermediário abstrato não paramétrico distribuição.
fonte
Não está claro se você deseja ou não contar processos.
Se eu interpretar a tag 'ensino' significa que você está ensinando o processo de Poisson, para ensinar sobre um processo em geral, o processo de Bernoulli é um processo aleatório fácil de explicar e visualizar e está relacionado ao processo de Poisson. O processo de Bernoulli é o analógico discreto, portanto pode ser um conceito complementar útil. É que, em vez de tempo contínuo, temos intervalos discretos de tempo.
Um exemplo pode ser um vendedor de porta em porta em que estamos contando sucessos de casas que fazem uma compra.
distribuição binomial B (n, p) em vez de um Poisson
Essa é a abordagem que Bertsekas e Tsitsiklis usam em Introdução à Probabilidade , 2ª ed., Introduzindo o processo de Bernoulli antes do processo de Poisson. Em seu livro, há mais extensões ao processo de Bernoulli aplicáveis ao processo de Poisson, como mesclá-las ou particioná-las, além de conjuntos de problemas com soluções.
Se você está procurando exemplos de processos aleatórios e deseja apenas lançar os nomes, existem alguns.
O processo gaussiano é significativo em aplicações. O processo de Weiner, em particular, que é um tipo de processo gaussiano, também é chamado de movimento browniano padrão e tem aplicações em finanças e física.
fonte
Como atuário de propriedades / acidentes, trato de exemplos da vida real de processos discretos que não são Poisson o tempo todo. Para linhas de negócios de alta gravidade e baixa frequência, a distribuição de Poisson é inadequada, pois exige uma razão de variância para média de 1. A distribuição binomial negativa, mencionada acima, é muito mais comumente usada, e as distribuições Delaporte é usado em algumas literaturas, embora com menos frequência na prática atuarial norte-americana padrão.
Por que isso é assim é uma questão mais profunda. O binômio negativo é muito melhor porque representa um processo de Poisson para o qual o parâmetro médio é ele próprio gama distribuído? Ou é porque as ocorrências de perda fracassam na independência (como os eventos de terremoto fazem sob a teoria atual de que quanto mais se espera que a Terra escorregue, mais provável é devido ao aumento da pressão), é não estacionário (os intervalos não podem ser subdivididos em sequências, cada uma das quais é estacionária, o que permitiria o uso de um Poisson não homogêneo) e, certamente, algumas linhas de negócios permitem ocorrências simultâneas (por exemplo, negligência médica com vários médicos cobertos pela apólice).
fonte
Outros mencionaram vários exemplos de processos pontuais que não são Poisson. Como o Poisson corresponde a tempos entre chegadas exponenciais, se você escolher qualquer distribuição de tempo entre chegadas que não seja exponencial, o processo de ponto resultante não será Poisson. AdamO apontou o Weibull. Você pode usar gama, lognormal ou beta como opções possíveis.
O Poisson tem a propriedade de que sua média é igual à sua variância. Um processo pontual com variação maior que a média é algumas vezes referido como super-disperso e, se a média for maior que a variação, é sub-disperso. Estes termos são usados para relacionar o processo a um Poisson. O binomial negativo é frequentemente usado porque pode ser super-disperso ou sub-disperso, dependendo de seus parâmetros.
O Poisson tem uma variação constante. Um processo pontual que se ajusta às condições de Poisson, exceto por não ter um parâmetro de taxa constante e, consequentemente, uma média e variância variáveis no tempo, é chamado de Poisson não homogêneo.
Um processo com tempos de chegada exponencial, mas que pode ter vários eventos no momento da chegada, é chamado de Poisson composto. Embora parecido com o processo de Poisson e possuindo um nome com a palavra Poisson, processos de Poisson não homogêneos e compostos são diferentes de um processo de ponto de Poisson.
fonte
Outro exemplo interessante do processo de contagem não-Poisson é representado pela distribuição Poisson truncada a zero (ZTPD). O ZTPD pode ajustar dados referentes ao número de idiomas que os indivíduos podem falar em condições fisiológicas. Nesse caso, a distribuição de Poisson é mal comportada, porque o número de idiomas falados é por definição> = 1: portanto, 0 é descartado a priori.
fonte
Acredito que você possa pegar o processo Poisson de chegada do cliente e ajustá-lo de duas maneiras diferentes: 1) as chegadas dos clientes são medidas 24 horas por dia, mas a loja não está realmente aberta o dia todo e 2) imaginam duas lojas concorrentes com Poisson processa os horários de chegada dos clientes e observa a diferença entre as chegadas nas duas lojas. (O exemplo 2 é do meu entendimento do Springer Handbook of Engineering Statistics, Parte A Property 1.4.)
fonte
Você pode reconsiderar o exemplo do futebol. Parece que as taxas de pontuação para as duas equipes aumentam com o decorrer da partida e que elas mudam quando as equipes alteram suas prioridades de ataque / defesa em resposta à pontuação atual.
Ou melhor, use-o como um exemplo de como modelos simples podem ter um desempenho surpreendentemente bom, estimulando o interesse na investigação estatística de algum fenômeno e fornecendo uma referência para estudos futuros que coletam mais dados para investigar discrepâncias e propor elaborações.
Dixon & Robinson (1998), "Um modelo de processo de nascimento para partidas de futebol de associação", The Statistician , 47 , 3.
fonte
Como a questão está relacionada a tornar a distribuição de Poisson mais compreensível, vou tentar, já que recentemente examinei um pouco os padrões de chamada de entrada do call center (que seguem uma distribuição exponencial sem memória e com o passar do tempo).
Penso que investigar outro modelo tangencial que requer essencialmente o conhecimento de Poisson para perceber como não é um pode ser um pouco confuso, mas sou apenas eu.
Eu acho que o problema de entender Poisson é o eixo de tempo contínuo em que ele está - a cada segundo, o evento não tem mais probabilidade de ocorrer - mas quanto mais longe você for no futuro, mais certo será. acontecendo.
Realmente, acho que simplifica o entendimento se você trocar o eixo do 'tempo' por 'ensaios' ou 'eventos'.
Alguém pode me corrigir se isso estiver fora da base, pois acho que é uma explicação fácil, mas acho que você pode substituir o lançamento de uma moeda ou o lançamento de um dado por 'tempo até que um telefonema chegue' (o que eu normalmente usado para equipe Erlang C / call center).
Em vez de 'tempo até que cheguem os telefonemas' ---- você pode substituí-lo por ... 'rola até que um dado atinja seis'.
Isso segue a mesma lógica geral. A probabilidade (como qualquer jogo) é completamente independente a cada jogada (ou minuto) e não tem memória. No entanto, a probabilidade de 'não 6' diminui cada vez mais lentamente, mas certamente para 0, à medida que você aumenta o número de tentativas. É mais fácil se você vir os dois gráficos (probabilidade de fazer uma chamada com o tempo versus probabilidade de seis com as jogadas).
Não sei se isso faz sentido - foi o que me ajudou a colocar isso em termos concretos. Agora, a distribuição de poisson é uma contagem, em vez de 'tempo entre chamadas' ou 'tentativas até o número seis' - mas depende dessa probabilidade.
fonte
Número de visitas de um cliente individual ao supermercado dentro de um determinado intervalo de tempo.
Depois de chegar ao supermercado, é improvável que você retorne por um tempo, a menos que tenha cometido um erro de planejamento.
Eu acho que a distribuição Binomial Negativa poderia ser usada aqui, mas é discreta, enquanto as visitas são em tempo contínuo.
fonte