Distribuições em listas classificadas

10

Digamos que temos uma lista ordenada de itens

[a, b, c, ... x, y, z, ...]

Estou procurando uma família de distribuições com suporte na lista acima, governada por algum parâmetro alfa, para que:

  • Para alfa = 0, atribui a probabilidade 1 ao primeiro item, a acima, e 0 ao restante. Ou seja, se fizermos uma amostra dessa lista, com substituição, sempre obtemos a.
  • À medida que o alfa aumenta, atribuímos probabilidades cada vez mais altas ao restante da lista, respeitando a ordem da lista, após o decaimento exponencial.
  • Quando alpha = 1, atribuímos igual probabilidade a todos os itens da lista, portanto, a amostragem da lista é semelhante a ignorar sua ordem.

Isso é muito semelhante à distribuição geométrica, mas existem algumas diferenças notáveis:

  • A distribuição geométrica da distribuição é definida sobre todos os números naturais. No meu caso acima, a lista tem tamanho fixo.
  • A distribuição geométrica não está definida para alfa = 0.
Amelio Vazquez-Reina
fonte
11
Você parece descrever uma família de distribuições geométricas truncadas. No entanto, existem infinitamente muitas famílias que se comportam qualitativamente como sua descrição. Mais importante, então, seria explicar para que você gostaria de usar essa família.
whuber
Thanks @whuber Sim, eu entendo que existem infinitas distribuições que se encaixam nessa descrição. Algum específico que vem à mente? Eu tenho um sistema que atualmente escolhe o primeiro elemento desta lista (representando pontuações), mas quero randomizar essa opção (e parametrizar essa randomização). Não estou procurando um tipo específico de "decaimento" baseado em alfa. Desde que alpha = 0 não represente aleatorização, ou seja, escolha o primeiro elemento, 1 represente "escolha qualquer elemento" e alfas entre 0 e 1 representem "algo entre" esses dois alfas, seria bom o suficiente.
Amelio Vazquez-Reina

Respostas:

11

Vamos supor que , a classificação do elemento da lista , tenha um valor em para uma lista com elementos (os vínculos podem ser quebrados aleatoriamente). Então poderíamos definir a probabilidade de selecionar para ser: i { 0 , 1 , , n - 1 } n irii{0,1,,n1}ni

pi=αrik=1nαrk

Este é basicamente apenas uma distribuição geométrica truncada apropriadamente normalizados, e que também está relacionado com a função Softmax . No caso especial de , use a convenção . Observe que o denominador sempre pode ser escrito em uma expressão simples de forma fechada. Para , assume o valor e, para , assume o valor .0 0 = 1 α < 1 1 - α nα=000=1α<1 α=1n1αn1αα=1n

Com , fica claro que isso apenas atribui igual probabilidade a cada elemento. Como , isso se aproxima de fornecer toda a massa de probabilidade ao primeiro elemento.α 0α=1α0

Em uma lista com 10 elementos, a diminuição aproximadamente exponencial solicitada é clara com :α=0.5

p00.5005p10.2502p20.1251p30.0626p40.0313p50.0156p60.0078p70.0039p80.0020p90.0010

A seguir, plotamos como a probabilidade do primeiro elemento sendo selecionado muda com base em , usando uma lista de comprimento 10.α

insira a descrição da imagem aqui

josliber
fonte
Agradável. Isso é muito mais inteligente do que eu jamais poderia esperar ser.
Matthew Drury
@ Matthew Estas são as distribuições geométricas truncadas às quais me referi anteriormente.
whuber
4

Vou tentar construir um exemplo a partir dos primeiros princípios.

Vamos considerar três distribuições como nossos blocos de construção:

  • P é a distribuição que atribui uma probabilidade ao primeiro elemento da lista, zero a todos os outros.
  • E é a distribuição que atribui a probabilidade ao primeiro elemento da lista, ao próximo, e assim por diante. Como a lista é finita, eles não serão somados a , mas podemos normalizar para obter uma distribuição de probabilidade.12141
  • U é a distribuição uniforme na lista.

Agora queremos ter uma família de um parâmetro de combinações convexas positivas dessas distribuições

α(t)P+β(t)E+γ(t)U

onde para todos os , com a propriedade adicional que e . α(t)+β(t)+γ(t)=1t[0,1]α(0)=1γ(1)=1

Geometricamente, queremos que trace uma curva no triângulo equilátero entre os pontos que começa na primeira esquina e termina na última. Além disso, como queremos que a distribuição pareça "exponencial" no meio do período, gostaríamos que a curva ocupasse o interior do triângulo nos momentos .(α(t),β(t),γ(t))(1,0,0),(0,1,0),(0,0,1)t(0,1)

Aqui está uma opção para a curva:

(1t(1t))(1t,0,t)+t(1t)(13,13,13)

Eu construí esse trabalho de trás para frente a partir das propriedades que gostaríamos. A curva corre ao longo da borda do triângulo entre os vértices inicial e final. O restante da fórmula é apenas uma soma convexa dessa curva de aresta e o ponto único , que empurra a curva ao longo da borda para o interior às vezes .( 1(1t,0,t)t(0,1)(13,13,13)t(0,1)

Matthew Drury
fonte