Eu tenho uma variável aleatória que recebe valores nos números inteiros não negativos , chame as probabilidades para cada resultado . Eu posso provar da distribuição de de forma independente e barata; Atualmente, tenho um tamanho de amostra de . Parece que , com decaimento aproximadamente exponencial.
Eu tenho uma sequência de formas quadráticas com coeficientes positivos:
- ...
- ...
O que eu gostaria de ter é um intervalo de confiança para os menos de largura, mas aceitarei o que puder.
Eu tenho limites rigorosos no , e como os coeficientes dos 's são todos positivos, é fácil transformá-los em limites rigorosos para os 's. Mas não sei como fazer isso corretamente com intervalos de confiança.
Isso é sobre o quê? Encontrei um fenômeno bizarro na teoria dos números e sei como provar que isso realmente acontece, mas, na verdade, isso exigirá algum esforço de programação da minha parte e uma quantidade considerável de tempo em nosso cluster local. Antes de investir esse tempo e entupir nossa máquina, gostaria de ter mais certeza do que sou de que o fenômeno é real.
Quero quantificar a razoabilidade da minha afirmação de que e . Minhas estimativas indicam que é de cerca de , e é por isso que eu queria ICs nessa resolução.
Corrija um número inteiro grande e deixe ser um subconjunto uniformemente escolhido de (ou seja, cada subconjunto específico tem probabilidade de ser escolhido). Seja a probabilidade de que exatamente dos números de não possa ser escrito como uma soma de dois elementos de ; deixe . É um pouco complicado de provar, mas esses limites existem e . Agora não é surpresa que seja pequeno e, à medida que aumenta,aumenta, tem um pico e decai exponencialmente. A parte bizarra é que existe um viés contra 7. Ou seja, experimentalmente e . Ou seja, o que não foi uma surpresa na verdade não é verdade: a distribuição é bimodal.
Eu posso expressar os 's (usando alguma teoria) como acima, sem o limite em termos dessa outra distribuição, definida pelos ' s. Isso é útil porque tenho uma maneira de vincular rigorosamente os usando, como mencionei acima, alguns cálculos grandes. Além disso, eu tenho um conjunto de dados muito grande para a variável
fonte
Respostas:
Na minha resposta, forneço muitos links para material de fundo para economizar espaço aqui. Vou escrever minha resposta, usando as informações nos links, conforme indicado.
Eu acho que uma abordagem bayesiana é um ajuste natural para esse problema, especialmente porque você tenta se convencer. É um pouco complicado usar intervalos de confiança para responder à pergunta com a qual você realmente se importa, ou seja, quão plausível é que e deram a amostra da distribuição? A abordagem bayesiana permite que você lide diretamente com essa questão.Q7<Q6 Q7<Q8 zi
Função de probabilidade
Seja a frequência observada do resultado inteiro na sua amostra e seja o tamanho da amostra. A função de probabilidade é proporcional à distribuição multinomial . Tem a formafk k N
Distribuição prévia
A distribuição de Dirichlet é a escolha natural para a distribuição anterior, porque é o conjugado anterior para a probabilidade multinomial. Tem a forma
Essa prévia possui nove hiperparâmetros (os valores ) e é um pouco difícil de lidar. Nesse contexto de "grande amostra", qualquer escolha razoável de valores de hiperparâmetros terá influência desprezível no resultado, mas, ainda assim, acho que vale a pena dedicar um pouco de esforço à seleção de valores sensíveis.αi
Aqui está como eu recomendo definir os hiperparâmetros. Primeiro, observe que nesta distribuição . Em seguida, observe que a distribuição máxima de entropia mais simples sobre os naturais é a distribuição geométrica . Então prepareE(zi)=αi∑8i=0αi
Então , de modo que a distribuição do valores é centrado em uma distribuição geométrica (truncada). Além disso, , de modo que o valor de controla a dispersão em torno dessa expectativa, mas não afeta a expectativa em si.E(zi)=ri(1−r1−r9) zi Var(zi)∝1(A+1) A
Esta especificação reduz o número de hiperparâmetros dos nove valores para apenas e . Vou adiar a discussão de valores específicos de e para agora.αi r A r A
Probabilidade posterior da proposição de interesse
A distribuição posterior dos valores de é a seguinte distribuição de Dirichlet:zi
Deixe . A probabilidade posterior em que você está interessado éY={z0,...z8|Q7<Q6 and Q7<Q8}
Essa integral é intratável, mas você pode calcular numericamente a probabilidade de interesse usando o seguinte algoritmo de Monte Carlo.
Para de a ,j 1 J
Prove um conjunto de valores de sua distribuição posterior.zi
Use os valores amostrados para calcular que é a função do indicador.yj=I(Q7<Q6)I(Q7<Q8) I(⋅)
Então .Pr(Q7<Q6 and Q7<Q8|f0,...,f8)≈∑Jj=0yjJ
A precisão da aproximação de Monte Carlo é a seguinte: : obterá pelo menos duas casas decimais de precisão 19 vezes em 20, obterá pelo menos três casas decimais de precisão 19 vezes em 20, etc.J−−√ J=104 J=106
E se a sua probabilidade de interesse posterior não for próxima de 0 ou 1, basta amostrar mais dados, enxaguar e repetir.
Hiperparâmetros anteriores, parte dois
O expoente de na expressão para a densidade posterior ézi
Pode-se observar que o hiperparâmetro desempenha o mesmo papel na distribuição anterior que na probabilidade - é uma espécie de "tamanho da amostra anterior". Para garantir que o prior tenha uma influência desprezível na conclusão, basta escolher um valor de tal que ; por exemplo, .A N A A≪N A=1
Para definir , observe que você pode calcular a probabilidade anterior da proposição usando o mesmo algoritmo de Monte Carlo descrito acima, mas com a distribuição anterior no lugar da distribuição posterior na etapa 1 do ciclo. Tente encontrar um valor de que dê uma probabilidade anterior de 0,5 (ou menor, se você achar que é mais razoável).r Q7<Q6 and Q7<Q8 r
fonte
Presumo que o z_k não seja probabilidades, mas frequências de amostra. Isso ocorre porque, caso contrário, Q_i (z_0, ..., z_i) não é uma variável aleatória. Nesse caso, calcular a variação dos Q_i é álgebra direta. Defina, primeiro, os indicadores de eventos Z_i que são 1 se Z == i, 0 caso contrário. É uma variável aleatória de Bernoulli com probabilidade p_i. Você pode calcular o primeiro e o segundo momento de qualquer uma dessas variáveis e elas devem fornecer todos os termos necessários para calcular a variação dos Q_i.
fonte
Kevin, por favor, tenha cuidado, pois terei que mudar sua notação um pouco: seus não são meus .zi zi
Penso que vale a pena tentar a seguinte solução bayesiana. Cozinhe um parâmetro aleatório e deixe ser condicionalmente iid, dado , com . Use a notação . Você já tem uma amostra dos 's, com . Defina as variáveis aleatórias Para (se este não está claro, dê uma olhada ). Agora, nesta formulação, suas formas quadráticasΛ>0 Z1,…,Zn Λ=λ Zi∣Λ=λ∼Poisson(λ) Z=(Z1,…,Zn) z=(z1,…,zn) Zi n=228
fonte