Como eu tenho certeza que todos aqui já sabem, o PDF da distribuição Beta é fornecido por
Eu tenho procurado em todo o lugar por uma explicação das origens dessa fórmula, mas não consigo encontrá-la. Todos os artigos que encontrei na distribuição Beta parecem fornecer essa fórmula, ilustrar algumas de suas formas e depois discutir diretamente seus momentos.
Não gosto de usar fórmulas matemáticas que não possam derivar e explicar. Para outras distribuições (por exemplo, gama ou binomial), há uma derivação clara que posso aprender e usar. Mas não consigo encontrar nada parecido para a distribuição Beta.
Então, minha pergunta é: quais são as origens dessa fórmula? Como pode ser derivado dos primeiros princípios em qualquer contexto em que foi originalmente desenvolvido?
[Para esclarecer, não estou perguntando sobre como usar a distribuição Beta nas estatísticas bayesianas, ou o que isso significa intuitivamente na prática (li o exemplo do beisebol). Eu só quero saber como obter o PDF. Havia uma pergunta anterior que perguntava algo semelhante, mas estava marcada (penso incorretamente) como uma duplicata de outra pergunta que não abordava o problema, por isso não consegui encontrar nenhuma ajuda até agora.]
EDIT 06-05-2017: Obrigado a todos pelas perguntas. Eu acho que uma boa explicação do que eu quero vem de uma das respostas que recebi quando perguntei a alguns de meus instrutores do curso:
"Acho que as pessoas podem derivar a densidade normal como um limite de uma soma de n coisas divididas por sqrt (n), e você pode derivar a densidade de poisson da idéia de eventos que ocorrem a uma taxa constante. Da mesma forma, para derivar a densidade beta, você teria que ter algum tipo de idéia do que torna uma distribuição beta algo independente e logicamente anterior à densidade ".
Portanto, a ideia "ab initio" nos comentários provavelmente é a mais próxima do que estou procurando. Eu não sou um matemático, mas me sinto mais confortável usando a matemática que posso derivar. Se as origens são muito avançadas para eu lidar, que assim seja, mas se não, eu gostaria de entendê-las.
fonte
Respostas:
Como ex-físico, posso ver como isso poderia ter sido derivado. É assim que os físicos procedem:
quando encontram um integrante finito de uma função positiva, tal como função beta : eles definem instintivamente uma densidade: f ( s | x , y ) = s x - 1 ( 1 - s ) y - 1
Eles fazem isso com todos os tipos de integrais o tempo todo com tanta frequência que acontece reflexivamente, sem sequer pensar. Eles chamam esse procedimento de "normalização" ou nomes semelhantes. Observe como, por definição, trivialmente, a densidade tem todas as propriedades que você deseja, como sempre positivas e adiciona uma.
A densidade que eu dei acima é da distribuição Beta.f(t)
ATUALIZAR
@ whuber's está perguntando o que há de tão especial na distribuição Beta, enquanto a lógica acima pode ser aplicada a um número infinito de integrais adequadas (como observei na minha resposta acima)?
A parte especial vem da distribuição binomial . Escreverei seu PDF usando notação semelhante à minha beta, não a notação usual para parâmetros e variáveis:
Aqui, - número de sucessos e fracassos es - probabilidade de sucesso. Você pode ver como isso é muito semelhante ao numerador na distribuição Beta. De fato, se você procurar o anterior para a distribuição Binomial, será a distribuição Beta. Não é surpreendente também porque o domínio de Beta é de 0 a 1, e é isso que você faz no teorema de Bayes: integrar sobre o parâmetro s , que é a probabilidade de sucesso, neste caso, como mostrado abaixo: f ( x | X ) = f ′ ( X | s ) f ( s )x,y s s
aquif(s)- probabilidade (densidade) de probabilidade de sucesso, dadas as configurações anteriores de distribuição Beta, ef'(X|s)- densidade de este conjunto de dados (ou seja, sucesso e falhas observados), dada uma probabilidades.
fonte
fonte
Antes de tudo, não sou bom em descrições matematicamente precisas de conceitos na minha cabeça, mas tentarei o meu melhor usando um exemplo simples:
Em outras palavras, a distribuição beta pode ser vista como a distribuição de probabilidades no centro de uma distribuição instável.
A : Deslocamento de teste 1D simulado, obtido a partir da distribuição de jitter na inserção (P( J i t t e r ) α g( X )p - 1 ) O campo de tiro com média de teste (linha preta sólida) é mais amplo e possui uma taxa de pico mais baixa em comparação com a curva de ajuste subjacente sem tremulação (linha azul sólida, parâmetros usados:λm a x= 10 , p = 0,6 , q= 0,5 . B : A distribuição resultante deλ às x0 0 em N = 100 tentativas e no pdf analítico da distribuição Beta. C : Distribuição simulada de contagem de pico de um processo de Poisson com parâmetrosλEu onde eu denoto os índices dos ensaios e a distribuição Beta-Poisson resultante, como derivado como esboçado acima. D : Situação análoga em 2D com ângulos de deslocamento aleatórios levando a estatísticas idênticas.
fonte