Construindo um rv discreto tendo como suporte todos os racionais em

19

Esta é a sequela construtivista desta questão .

Se não pudermos ter uma variável aleatória uniforme e discreta tendo como suporte todos os racionais no intervalo [0,1] , a próxima melhor coisa é:

Construa uma variável aleatória Q que possua esse suporte, QQ[0,1] , e que siga alguma distribuição. E o artesão em mim exige que essa variável aleatória seja construída a partir de distribuições existentes, em vez de criada definindo abstratamente o que desejamos obter.

Então, eu vim com o seguinte:

Seja X uma variável aleatória discreta, seguindo a Variante de distribuição geométrica II com o parâmetro 0<p<1 , a saber

X{0,1,2,...},P(X=k)=(1p)kp,FX(X)=1(1p)k+1

Seja também Y uma variável aleatória discreta, seguindo a Variante de distribuição geométrica I com parâmetro idêntico p , a saber

Y{1,2,...},P(Y=k)=(1p)k1p,FY(Y)=1(1p)k

X eY são independentes. Defina agora a variável aleatória

Q=XY

e considere a distribuição condicional

P(Qq{XY})

Em palavras frouxas " condicional Qé a razão de X sobre Y condicional em X sendo menor ou igual a Y ". O suporte desta distribuição é condicional .{0,1,1/2,1/3,...,1/k,1/(k+1),...,2/3,2/4,...}=Q[0,1]

A "pergunta" é: alguém pode fornecer a função de massa de probabilidade condicional associada?

Um comentário perguntou "deve ser fechado"? Como o que constitui uma forma fechada hoje em dia não é tão claro, deixe-me colocar desta maneira: estamos procurando uma forma funcional na qual possamos inserir um número racional de e obter a probabilidade (para alguns valor especificado do parâmetro p, é claro), levando a um gráfico indicativo do pmf. E então varie p para ver como o gráfico muda.[0,1]pp

Se ajudar, podemos abrir um ou os dois limites do suporte, embora essas variantes nos privem da capacidade de representar graficamente os valores superiores e / ou inferiores do pmf . Além disso, se abrirmos o limite superior, devemos considerar o evento de condicionamento .{X<Y}

Como alternativa, também dou boas-vindas a outros RVs que têm esse suporte, desde que eles se juntem ao seu pmf .

Eu usei a distribuição geométrica porque ela prontamente disponível duas variantes com o que não inclui zero no suporte (para que a divisão por zero é evitada). Obviamente, pode-se usar outros RVs discretos, usando algum truncamento.

Certamente colocarei uma recompensa nessa questão, mas o sistema não permite isso imediatamente.

Alecos Papadopoulos
fonte
1
Você quer dizer ? (definindo uma variável aleatória conditionnally em algo não faz sentido, só poderia definir sua distribuição dessa maneira)Q=XY1{XY}
Stéphane Laurent
1
Seu Q é contável: você sabe que existe uma correspondência de 1 a 1 entre N = {1, 2, ...} e Q. Se você pudesse encontrar essa correspondência, a solução seria escolher qualquer distribuição sobre N e usá-la para escolher o elemento correspondente de Q.
Adrian
Pr(X/Y=p/q)p/qPr(X=p,X=2p,)×Pr(Y=q,Y=2q,)
1
O requisito de fornecer o pmf significa que é necessário um formulário fechado? Ou, por exemplo, a soma infinita de @ StéphaneLaurent é suficiente para atender à condição?
Juho Kokkala
1
Deixe e Y o RV no seu post. P r [ Q = q ] = P r [ Y = f - 1 ( q ) ]f:NQ[0,1]Pr[Q=q]=Pr[Y=f1(q)]
Adrian

Respostas:

19

Considere a distribuição discreta com suporte no conjunto com massas de probabilidade{ ( p , q )F{(p,q)|qp1}N2

F(p,q)=321+p+q.

Isso é facilmente resumido (todas as séries envolvidas são geométricas) para demonstrar que realmente é uma distribuição (a probabilidade total é de unidade).

Para qualquer número diferente de zero racional deixar ser sua representação em termos mais baixo: isto é, e .a / b = x b > 0 gcd ( a , b ) = 1xa/b=xb>0gcd(a,b)=1

G [ 0 , 1 ] QF induz uma distribuição discreta em através das regrasG[0,1]Q

G(x)=G(ab)=n=1F(an,bn)=321+a+b2.

(e ). Todo número racional em tem probabilidade diferente de zero. (Se você precisar incluir entre os valores com probabilidade positiva, retire parte da probabilidade de outro número - como e atribua-o a ).( 0 , 1 ] 0 1 0G(0)=0(0,1]010

Para entender essa construção, veja esta representação de :F

[Figura de F]

p , q F p / q p q 0 1 L L L ( 1 ) 1 F ( 1 , 1 ) + F ( 2 , 2 ) + F ( 3 , 3 ) + 3 / 8 + 3 / 32 + 3 / 128 + = 1 / 2F fornece massas de probabilidade em todos os pontos com coordenadas integrais positivas. Os valores de são representados pelas áreas coloridas dos símbolos circulares. As linhas têm declives para todas as combinações possíveis de coordenadas e que aparecem na trama. Eles são coloridos da mesma maneira que os símbolos circulares: de acordo com suas inclinações. Assim, a inclinação (que claramente varia de a ) e a cor correspondem ao argumento de e os valores de são obtidos somando as áreas de todos os círculos em cada linha. Por exemplo,p,qFp/qpq01GGG(1)é obtido pela soma das áreas de todos os círculos (vermelhos) ao longo da diagonal principal da inclinação , dados por = .1F(1,1)+F(2,2)+F(3,3)+3/8+3/32+3/128+=1/2

Figura

Esta figura mostra uma aproximação a obtida pela limitação de : plota seus valores em números racionais que variam de a . As maiores massas de probabilidade são .Gq10030441/100112,314,110,362,362,142,

Aqui está o CDF completo de (preciso para a resolução da imagem). Os seis números listados anteriormente fornecem os tamanhos dos saltos visíveis, mas todas as partes do CDF consistem em saltos, sem exceção:G

Figura 2

whuber
fonte
1
Obrigado! Estou no processo de entender a construção. Apenas duas perguntas: a) é bivariada, mas na expressão que o vincula a G aparece univariada. Estou esquecendo de algo? e b) Como G é univariado, acho que todos os pontos no primeiro gráfico de aparência impressionante representam um valor diferente no eixo horizontal (embora, é claro, isso não possa ser fielmente representado nessa escala), estou certo? FGG
Alecos Papadopoulos
Acabei de concluir uma figura que poderia abordar seu comentário, Alecos, e a adicionei à resposta. Note que eu poderia ter começado com qualquer distribuição discreta e construído G da mesma maneira; essa distribuição específica foi escolhida para facilitar os cálculos. FG
whuber
Fica cada vez melhor. Quanto à minha primeira pergunta no comentário anterior, deveria ser vez deF(aF(ab,n)? Ou seja, quep=um/beq=n? F(abn)p=a/bq=n
Alecos Papadopoulos
Esta é uma resposta melhor que a minha! Notei duas pequenas coisas: acho que seu F (p, q) soma 4, conforme está escrito. Também na equação abaixo "F induz uma distribuição discreta G", você deve ter F (na, nb) não?
Adrian
@ Adrian, Alecos Obrigado por capturar esses erros de digitação: o deve ser a - 1 e a notação para F obviamente está incorreta. Vou consertá-los imediatamente. 11F
whuber
8

Vou juntar meus comentários e publicá-los como resposta apenas para maior clareza. Espero que você não fique muito satisfeito, no entanto, pois tudo o que faço é reduzir o seu problema para outro problema.

Minha anotação:

é um RV cujo suporte é Q[ 0 , 1 ] - meu Q nãoéigual ao Q que o OP constrói a partir de seu XQQ[0,1]QQ . Vamos definir esseQusandoYef, que apresento abaixo.XYQYf

é qualquer RV cujo suporte é N{ 1 , 2 , } - o Y dado pelo OP funcionaria, por exemplo.YN{1,2,}Y

é qualquer correspondência um a um f : NQ[ 0 , 1 ] e f - 1 é o seu inverso. Nós sabemos que estes existem.ff:NQ[0,1]f1

Agora, afirmo que posso reduzir seu problema apenas para encontrar um e seu f - 1 :ff1

Apenas deixe e pronto. O PMF de Q é Pr [ Q = q ] = Pr [ Y = f - 1 ( q ) ] .Q=f(Y)QPr[Q=q]=Pr[Y=f1(q)]

Editar:

Aqui está uma função g que desempenha o papel de , apesar de não ser uma correspondência individual (por causa de duplicatas):f

g <- function(y) {
    y <- as.integer(y)
    stopifnot(y >= 1)
    b <- 0
    a <- 0
    for (unused_index in seq(1, y)) {
        if (a >= b) {
            b <- b+1
            a <- 0
        } else {
            a <- a+1
        }
    }
    return(sprintf("q = %s / %s", a, b))
    ## return(a / b)
}
Adrian
fonte
(+1) Não, considero sua abordagem um excelente exemplo de como alguém pode pensar e usar a abordagem abstrata para chegar a resultados e algoritmos muito aplicáveis . O ponto principal, como agora o entendo, é que é possível obter a construção desejada usando como forma funcional o pmf de qualquer distribuição discreta com suporte . Claro que continua a encontrar f e f - 1 . Como você entende melhor essa abordagem do que eu, a frase "sabemos que essas existem" é uma maneira educada de dizer "mas não temos idéia de como elas se parecem"? :)N{1,2,}ff1
Alecos Papadopoulos
Veja jcu.edu/math/vignettes/infinity.htm : você pode usar um "padrão diagonal" semelhante. A parte difícil é obter uma expressão para . Não sei ao certo como fazer isso, mas você pode perguntar em math.stackexchange.com (ou pesquisar mais no Google primeiro). f1
Adrian
No link que você forneceu, diz em algum momento: "Observe que não é necessário encontrar uma fórmula para a correspondência; tudo o que é necessário é a certeza de que essa correspondência existe. Existem muitas outras instâncias na matemática que são assim. - onde o objetivo é mostrar que algo tem que acontecer ou que existe algo, em vez de realmente exibir uma fórmula ". Bem, o ponto em minha pergunta é realmente exibir uma fórmula : chamei essa pergunta de "construtivista" por uma razão.
Alecos Papadopoulos
1
Acho que posso fornecer um algoritmo que funcionaria - pensarei um pouco mais sobre isso.
Adrian
Postei algo - permite simular o Q, mas não resolve o problema do PMF.
21914 Adrian