Neste artigo atual da CIÊNCIA, o seguinte está sendo proposto:
Suponha que você divida aleatoriamente 500 milhões de renda entre 10.000 pessoas. Só existe uma maneira de oferecer a todos 50.000 partes iguais. Portanto, se você distribuir ganhos aleatoriamente, a igualdade é extremamente improvável. Mas existem inúmeras maneiras de dar a poucas pessoas muito dinheiro e muitas pessoas um pouco ou nada. De fato, dadas todas as maneiras pelas quais você pode dividir a renda, a maioria produz uma distribuição exponencial da renda.
Eu fiz isso com o seguinte código R, que parece reafirmar o resultado:
library(MASS)
w <- 500000000 #wealth
p <- 10000 #people
d <- diff(c(0,sort(runif(p-1,max=w)),w)) #wealth-distribution
h <- hist(d, col="red", main="Exponential decline", freq = FALSE, breaks = 45, xlim = c(0, quantile(d, 0.99)))
fit <- fitdistr(d,"exponential")
curve(dexp(x, rate = fit$estimate), col = "black", type="p", pch=16, add = TRUE)
Minha pergunta
Como posso analiticamente provar que a distribuição resultante é realmente exponencial?
Adendo
Obrigado por suas respostas e comentários. Eu pensei no problema e criei o seguinte raciocínio intuitivo. Basicamente, acontece o seguinte (Cuidado: simplificação excessiva à frente): Você meio que aumenta a quantia e joga uma moeda (tendenciosa). Toda vez que você recebe, por exemplo, cabeças, você divide a quantia. Você distribui as partições resultantes. No caso discreto, o lançamento da moeda segue uma distribuição binomial, as partições são distribuídas geometricamente. Os análogos contínuos são a distribuição de poisson e a distribuição exponencial, respectivamente! (Pelo mesmo raciocínio, também fica intuitivamente claro por que a distribuição geométrica e a exponencial têm a propriedade de falta de memória - porque a moeda também não tem memória).
Respostas:
Para tornar o problema mais simples, vamos considerar o caso em que os valores permitidos para o compartilhamento de cada pessoa são discretos, por exemplo, números inteiros. Equivalentemente, também se pode imaginar dividindo o "eixo da renda" em intervalos igualmente espaçados e aproximando todos os valores que caem em um determinado intervalo pelo ponto médio.
Denotando a renda total como , o s- ésimo valor permitido como x s , o número total de pessoas como N e, finalmente, o número de pessoas com ações de x s como n s , devem ser satisfeitas as seguintes condições: C 1 ( { n s } ) ≡ Σ s n s - N = 0 , e C 2 ( { n s } ) ≡ Σ s n sX s xs N xs ns
Observe que muitas maneiras diferentes de dividir o compartilhamento podem representar a mesma distribuição. Por exemplo, se considerarmos dividir US $ 4 entre duas pessoas, dar US $ 3 a Alice e US $ 1 a Bob e vice-versa forneceriam distribuições idênticas. Como a divisão é aleatória, a distribuição com o número máximo de maneiras correspondentes de dividir o compartilhamento tem a melhor chance de ocorrer.
Para obter essa distribuição, é preciso maximizar sob as duas restrições dadas acima. O método dos multiplicadores de Lagrange é uma abordagem canônica para isso. Além disso, pode-se optar por trabalhar comlnW emvez de com opróprioW, pois "ln" é uma função crescente monótona. Ou seja, ∂lnW
fonte
Na verdade, você pode provar que não é realmente exponencial, quase trivialmente:
No entanto, não é muito difícil perceber que, para o seu exemplo de diferença uniforme, ele deve ser quase exponencial.
Considere um processo de Poisson - onde os eventos ocorrem aleatoriamente ao longo de alguma dimensão. O número de eventos por unidade do intervalo tem uma distribuição de Poisson, e a diferença entre os eventos é exponencial.
Se você tomar um intervalo fixo, os eventos em um processo Poisson que se enquadram nele serão distribuídos uniformemente no intervalo. Veja aqui .
[No entanto, observe que, como o intervalo é finito, você simplesmente não pode observar intervalos maiores que o comprimento do intervalo, e intervalos quase tão grandes serão improváveis (considere, por exemplo, um intervalo de unidade - se você observar intervalos de 0,04 e 0,01, a próxima lacuna que você vê não pode ser maior que 0,95).]
Mais especificamente, qualquer lacuna que comece no intervalo colocado sobre o processo de Poisson tem a chance de ser "censurada" (efetivamente, cortada mais curta do que seria de outra forma) executando o final do intervalo.
É mais provável que intervalos mais longos o façam do que intervalos mais curtos, e mais intervalos no intervalo significam que o comprimento médio do intervalo deve diminuir - intervalos mais curtos. Essa tendência a ser "cortada" tenderá a afetar a distribuição de intervalos mais longos do que os curtos (e não há chance de que um intervalo limitado ao intervalo exceda a duração do intervalo - portanto, a distribuição do tamanho do intervalo deve diminuir sem problemas zero no tamanho de todo o intervalo).
No diagrama, um intervalo longo no final foi reduzido e um intervalo relativamente menor no início também é menor. Esses efeitos nos afastam da exponencialidade.
Aqui está uma simulação da distribuição de lacunas para n = 2:
Não é muito exponencial.
fonte
Vamos supor que o dinheiro seja infinitamente divisível para que possamos lidar com números reais e não com números inteiros.
fonte
Dizer "suponha que você divida aleatoriamente 500 milhões de renda entre 10.000 pessoas" não é suficientemente específico para responder à pergunta. Existem muitos processos aleatórios diferentes que podem ser usados para alocar uma quantia fixa de dinheiro a um número fixo de pessoas, e cada um terá suas próprias características para a distribuição resultante. Aqui estão três processos generativos em que eu poderia pensar e as distribuições de riqueza que cada uma cria.
Método 1, publicado pelo OP:
Escolha números 'p' de [0, w) uniformemente aleatoriamente. Classifique estes. Acrescente '0' à frente. Distribua valores em dólares representados pelas diferenças entre elementos sucessivos nesta lista.
Método 2:
Escolheu números 'p' de [0, w) uniformemente aleatoriamente. Considere esses 'pesos', para que 'w' não seja realmente importante nesse estágio. Normalize os pesos. Distribua valores em dólares representados pela fração de 'w' correspondente a cada peso.
Método 3:
Comece com 'p' 0s. w vezes, adicione 1 a um deles, selecionado uniformemente aleatoriamente.
fonte
Deixe-me adicionar algo sobre o seu adendo.
No entanto, a execução da análise de erros não parece ser direta, porque diferentes amostras neste caso não são independentes. Eles precisam somar a quantia total, e quanto a primeira pessoa recebe afeta a distribuição de probabilidade da segunda pessoa e assim por diante.
Minha resposta anterior não sofre com esse problema, mas acho que seria útil ver como ele pode ser resolvido nessa abordagem.
fonte
Boa análise teórica feita pelas respostas votadas. No entanto, aqui está minha visão empírica simples sobre por que a distribuição é exponencial.
Quando você distribui o dinheiro aleatoriamente , vamos considerar que você faz um por um. Seja S a soma original.
Para o primeiro homem, você deve escolher uma quantidade aleatória entre 0 e S. Assim, em média, você escolherá S / 2 e permanecerá com S / 2.
Para o segundo homem, você escolheria aleatoriamente entre 0 e, em média, S / 2. Assim, em média, você escolherá S / 4 e permanecerá com S / 4.
Então, você basicamente dividiria a soma pela metade de cada vez (estatisticamente falando).
Embora em um exemplo da vida real você não tenha valores continuamente reduzidos pela metade, isso mostra por que se deve esperar que a distribuição seja exponencial.
fonte