Temos N amostras, , de uma distribuição uniforme onde é desconhecida. Estime partir dos dados. [ 0 , θ ] θ θ
Então, o governo de Bayes ...
e a probabilidade é:
(editar: quando para todos os e 0 caso contrário - obrigado whuber)i
mas sem outras informações sobre , parece que o prior deve ser proporcional a (ou seja, uniforme) ou a (Jeffreys prior?) em mas minhas integrais não convergir, e não tenho certeza de como proceder. Alguma ideia?1 1 [0,∞]
Respostas:
Isso gerou um debate interessante, mas observe que realmente não faz muita diferença para a questão do interesse. Pessoalmente, acho que porque é um parâmetro de escala, o argumento do grupo de transformação é apropriado, levando a um anterior deθ
Essa distribuição tem a mesma forma no redimensionamento do problema (a probabilidade também permanece "invariável" no redimensionamento). O núcleo deste anterior, pode ser derivado resolvendo a equação funcional . Os valores dependem do problema e realmente importam apenas se o tamanho da amostra for muito pequeno (como 1 ou 2). O posterior é um pareto truncado, dado por:f(y)=y−1 af(ay)=f(y) L,U
Mas agora suponha que usamos um prior mais geral, dado por (observe que mantemos os limites para garantir que tudo esteja correto - nenhuma matemática singular então ) O posterior é o mesmo que acima, mas com substituído por - desde que . Repetindo os cálculos acima, a média posterior simplificada dep(θ|cI)∝θ−c−1 L,U N c+N c+N≥0
Portanto, o uniforme anterior ( ) fornecerá uma estimativa de desde que (a média seja infinita para ). Isso mostra que o debate aqui é um pouco como usar ou como o divisor na estimativa de variância.c=−1 N−1N−2X(N) N≥2 N=2 N N−1
Um argumento contra o uso do uniforme impróprio anteriormente neste caso é que o posterior é impróprio quando , pois é proporcional a . Mas isso só importa se ou for muito pequeno.N=1 θ−1 N=1
fonte
Como o objetivo aqui é presumivelmente obter alguma estimativa válida e útil de , a distribuição anterior deve ser consistente com a especificação da distribuição da população da qual a amostra vem. Isso NÃO significa que "calculamos" o anterior usando a própria amostra - isso anularia a validade de todo o procedimento. Sabemos que a população da qual a amostra provém é uma população de variáveis aleatórias uniformes de iid, cada uma variando em . Esta é uma suposição mantida e faz parte das informações anteriores que possuímos (e não tem nada a ver com a amostra , isto é, com uma realização específica de um subconjunto dessas variáveis aleatórias).θ [0,θ]
Agora suponha que essa população consista em variáveis aleatórias (enquanto nossa amostra consiste em realizações de variáveis aleatórias). A suposição mantida nos diz quem n<m n
Indique para compacidade . Então temos que também pode ser escritomaxi=1,...,n{Xi}≡X∗ θ≥X∗
A função densidade dos de iid Uniform rv variando em émax N [0,θ]
para o suporte e zero em outro lugar. Então, usando e aplicando a fórmula de mudança de variável, obtemos uma distribuição anterior para que é consistente com a suposição mantida:[0,θ] θ=cX∗ θ
o que pode ser impróprio se não especificarmos a constante adequadamente. Mas nosso interesse reside em ter um posterior apropriado para e também não queremos restringir os possíveis valores de (além da restrição implícita na suposição mantida). Então deixamos indeterminado. Então, escrevendo a parte posterior éc θ θ c
X={x1,..,xn}
para alguma constante de normalização A. Queremos
Inserindo na parte posterior
Observe que a constante indeterminada da distribuição anterior foi cancelada convenientemente.c
O posterior resume todas as informações que a amostra específica pode nos fornecer sobre o valor de . Se queremos obter um valor específico para , podemos calcular facilmente o valor esperado do posterior,θ θ
Existe alguma intuição nesse resultado? Bem, à medida que o número de aumenta, o mais provável é que a realização máxima entre eles esteja cada vez mais próxima de seu limite superior, - que é exatamente o que o valor médio posterior de reflete: se, por exemplo, , , mas se . Isso mostra que nossa tática em relação à seleção do prior era razoável e consistente com o problema em questão, mas não necessariamente "ideal" em algum sentido.X θ θ N=2⇒E(θ∣X)=2x∗ N=10⇒E(θ∣X)=109x∗
fonte
Teorema uniforme de distribuição anterior (maiúsculas e minúsculas):
"Se a totalidade de Suas informações sobre externa aos dados for capturada pela proposição única então Sua única especificação anterior consistente em termos logicamente internos éθ D
Assim, sua especificação anterior deve corresponder à de Jeffrey, se você realmente acredita no teorema acima. "
Não faz parte do teorema uniforme de distribuição anterior:
Como alternativa, você pode especificar sua distribuição anterior como uma distribuição de Pareto, que é a distribuição conjugada do uniforme, sabendo que sua distribuição posterior terá que ser outra distribuição uniforme por conjugação. No entanto, se você usar a distribuição Pareto, precisará especificar parâmetros da distribuição Pareto de alguma forma.f(θ)
fonte