Digamos que temos uma lista ordenada de itens
[a, b, c, ... x, y, z, ...]
Estou procurando uma família de distribuições com suporte na lista acima, governada por algum parâmetro alfa, para que:
- Para alfa = 0, atribui a probabilidade 1 ao primeiro item, a acima, e 0 ao restante. Ou seja, se fizermos uma amostra dessa lista, com substituição, sempre obtemos
a
. - À medida que o alfa aumenta, atribuímos probabilidades cada vez mais altas ao restante da lista, respeitando a ordem da lista, após o decaimento exponencial.
- Quando alpha = 1, atribuímos igual probabilidade a todos os itens da lista, portanto, a amostragem da lista é semelhante a ignorar sua ordem.
Isso é muito semelhante à distribuição geométrica, mas existem algumas diferenças notáveis:
- A distribuição geométrica da distribuição é definida sobre todos os números naturais. No meu caso acima, a lista tem tamanho fixo.
- A distribuição geométrica não está definida para alfa = 0.
distributions
sampling
discrete-data
Amelio Vazquez-Reina
fonte
fonte
Respostas:
Vamos supor que , a classificação do elemento da lista , tenha um valor em para uma lista com elementos (os vínculos podem ser quebrados aleatoriamente). Então poderíamos definir a probabilidade de selecionar para ser: i { 0 , 1 , … , n - 1 } n irEu Eu { 0 , 1 , … , n - 1 } n Eu
Este é basicamente apenas uma distribuição geométrica truncada apropriadamente normalizados, e que também está relacionado com a função Softmax . No caso especial de , use a convenção . Observe que o denominador sempre pode ser escrito em uma expressão simples de forma fechada. Para , assume o valor e, para , assume o valor .0 0 = 1 α < 1 1 - α nα = 0 0 00 0= 1 α < 1 α=1n1 - αn1 - α α = 1 n
Com , fica claro que isso apenas atribui igual probabilidade a cada elemento. Como , isso se aproxima de fornecer toda a massa de probabilidade ao primeiro elemento.α → 0α=1 α→0
Em uma lista com 10 elementos, a diminuição aproximadamente exponencial solicitada é clara com :α=0.5
A seguir, plotamos como a probabilidade do primeiro elemento sendo selecionado muda com base em , usando uma lista de comprimento 10.α
fonte
Vou tentar construir um exemplo a partir dos primeiros princípios.
Vamos considerar três distribuições como nossos blocos de construção:
Agora queremos ter uma família de um parâmetro de combinações convexas positivas dessas distribuições
onde para todos os , com a propriedade adicional que e .α(t)+β(t)+γ(t)=1 t∈[0,1] α(0)=1 γ(1)=1
Geometricamente, queremos que trace uma curva no triângulo equilátero entre os pontos que começa na primeira esquina e termina na última. Além disso, como queremos que a distribuição pareça "exponencial" no meio do período, gostaríamos que a curva ocupasse o interior do triângulo nos momentos .(α(t),β(t),γ(t)) (1,0,0),(0,1,0),(0,0,1) t∈(0,1)
Aqui está uma opção para a curva:
Eu construí esse trabalho de trás para frente a partir das propriedades que gostaríamos. A curva corre ao longo da borda do triângulo entre os vértices inicial e final. O restante da fórmula é apenas uma soma convexa dessa curva de aresta e o ponto único , que empurra a curva ao longo da borda para o interior às vezes .( 1(1−t,0,t) t∈(0,1)(13,13,13) t∈(0,1)
fonte