Seja , , ..., como seus RVs com intervalo mas com distribuição desconhecida. (Aceito que a distribuição seja contínua etc., se necessário.)
Defina .
Eu sou dado , e perguntar: O que posso inferir, de uma maneira Bayesian, sobre ?
Ou seja, recebi a soma de uma amostra do tamanho dos VRs e gostaria de saber o que posso deduzir sobre a distribuição da soma de todos os RVs, usando uma abordagem bayesiana (e assumindo-se anteriores razoáveis sobre o distribuição).
Se o suporte fosse vez de , esse problema será bem estudado e (com anteriores uniformes) você obterá distribuições de compostos beta-binomiais para a distribuição inferida em . Mas não sei como abordá-lo com como o intervalo ...
Divulgação completa : Eu já postei isso no MathOverflow , mas me disseram que seria melhor postado aqui, então isso é uma re-publicação.
Respostas:
Considere a seguinte análise não paramétrica bayesiana.
Defina e deixe que sejam os subconjuntos Borel de . Seja uma medida finita diferente de zero .X=[0,1] B X α (X,B)
Seja um processo de Dirichlet com o parâmetro e suponha que sejam condicionais iid, dado que , de modo que , para cada .Q α X1,…,Xn Q=q μX1(B)=P{X1∈B}=q(B) B∈B
A partir das propriedades do processo Dirichlet, sabemos que, considerando , a distribuição preditiva de uma observação futura como é a medida over definido porX1,…,Xk Xk+1 β (X,B)
Agora, defina como o campo sigma gerado por e use a mensurabilidade e a simetria dos para obter quase certamente.Fk X1,…,Xk Xi
Para encontrar uma resposta explícita, suponha que seja . Definindo , temos quase com certeza (a distribuição conjunta de ), onde . No limite "não informativo" de , a expectativa anterior se reduz a , o que significa que, nesse caso, sua suposição posterior para é apenas vezes a média do primeiroα(⋅)/α(X) U[0,1] c=α(X)>0
fonte
Perdoe a teoria da falta de medida e os abusos de notação nos itens abaixo ...
Como essa é a inferência bayesiana, deve haver um pouco do desconhecido no problema, que neste caso é a distribuição de , um parâmetro de dimensão infinita que assume valores no conjunto de distribuições em (chame-o ). A distribuição de dados converge para uma distribuição normal; portanto, se for grande o suficiente ( teorema de Berry-Esseen ), podemos apenas dar um tapa nesse normal como uma aproximação. Além disso, se a aproximação for precisa, o único aspecto do que importa em termos práticos é o induzido antes em .X1 [0,1] π Sk|π k p(π) (Eπ(X1),Varπ(X1))=(μ,σ2)
Agora fazemos a previsão bayesiana padrão e colocamos as densidades aproximadas. ( está sujeito à mesma aproximação que .)Sn Sk
Para os limites da integral, , obviamente; Eu acho que ?μ∈[0,1] σ2∈[0,14]
Adicionado mais tarde: não,Isso é legal - os valores permitidos de dependem de , portanto as informações nos dados sobre são relevantes para .σ2∈[0,μ(1−μ)]. σ2 μ μ σ2
fonte
Deixe cadaXi pertencer à família de distribuição F e tem parâmetros θ .
Dado,Sk , temos uma distribuição em θ :
E nossa distribuição emSn , n≥k é
(e da mesma forma paran<k )
Ambas as equações têm boas formas quandoF é uma distribuição na família exponencial que é fechada sob a soma de elementos iid, como a distribuição normal, a distribuição gama e a distribuição binomial. Também funciona para seus casos especiais, como a distribuição exponencial e a distribuição de Bernoulli.
Pode ser interessante considerarF é a família de escalado (por 1n ) distribuições binomiais com "ensaios" conhecidos n e tomando o limite como n vai para o infinito.
fonte