Alguém pode esclarecer o conceito de uma "soma de variáveis ​​aleatórias"

21

Na minha classe de probabilidade, os termos "somas de variáveis ​​aleatórias" são constantemente usados. No entanto, estou preso no que exatamente isso significa?

Estamos falando da soma de várias realizações de uma variável aleatória? Se sim, isso não soma um único número? Como uma soma de realizações de variáveis ​​aleatórias nos leva a uma distribuição ou a uma função cdf / pdf / de qualquer tipo? E se não são realizações de variáveis ​​aleatórias, o que exatamente está sendo adicionado?

Fofoca
fonte
1
Por 'realização de uma variável aleatória', presumo que você queira dizer os valores reais observados. O que está sendo somado na 'soma das variáveis ​​aleatórias' são as variáveis ​​aleatórias antes de serem observadas. Imagine calcular o peso das próximas 5 pessoas para subir no elevador. Você ainda não conhece seus pesos e, portanto, cada um deles é uma variável aleatória. Mas você provavelmente gostaria de saber algo sobre a distribuição da soma de seus pesos.
PeterR
@ PeterR Isto é o que eu não entendo. Como faz sentido falar em adicionar algo que ainda não tem valor? É um tipo metafórico de soma?
Gosset
1
Acho que seu problema é que você não entende o que é uma variável aleatória. Se você entender esse conceito, a soma também será fácil.
Aksakal
@ Akksakal O fato de eu ter postado esta pergunta já é uma evidência disso? Talvez se você souber, você poderia esclarecer o conceito?
Gosset
Grandes respostas foram dadas. Outro bom exemplo é a soma dos dois dados, . O resultado é claramente aleatório (você não sabe de antemão qual será a soma dos dois dados). Sabemos que e independentes. Acontece que tem uma distribuição triangular. X+YX,YvocênEuf(1,6)X+Y
bdeonovic

Respostas:

39

Um modelo físico e intuitivo de uma variável aleatória é escrever o nome de cada membro de uma população em um ou mais pedaços de papel - "ingressos" - e colocar esses ingressos em uma caixa. O processo de misturar completamente o conteúdo da caixa, seguido de retirar cegamente um bilhete - exatamente como em uma loteria - modela a aleatoriedade. As probabilidades não uniformes são modeladas através da introdução de números variáveis ​​de tickets na caixa: mais tickets para os membros mais prováveis, menos para os menos prováveis.

Uma variável aleatória é um número associado a cada membro da população. (Portanto, para maior consistência, cada ticket de um determinado membro deve ter o mesmo número gravado nele.) Várias variáveis ​​aleatórias são modeladas reservando espaços nos tickets para mais de um número. Costumamos dar a esses espaços nomes como Y , e Z . A soma dessas variáveis ​​aleatórias é a soma usual: reserve um novo espaço em cada ticket para a soma, leia os valores de etc. em cada ticket e escreva sua soma nesse novo espaço. Essa é uma maneira consistente de escrever números nos tickets, por isso é outra variável aleatória.X, Y,ZY ,X, Y,

Figura

Esta figura retrata uma caixa representando uma população e três variáveis aleatórias X , Y , e X + Y . Ele contém seis passagens: da três para α (azul) dão uma probabilidade de 3 / 6 , os dois para β (amarelo) dão uma probabilidade de 2 / 6 , e o outro para γ (verde) dão uma probabilidade de 1 / 6Ω={α,β,γ}XYX+Yα3/6β2/6γ1/6. Para exibir o que está escrito nos tickets, eles são mostrados antes de serem misturados.

A beleza dessa abordagem é que todas as partes paradoxais da pergunta estão corretas:

  • a soma das variáveis ​​aleatórias é de fato um número único e definido (para cada membro da população),

  • no entanto, também leva a uma distribuição (dada pelas frequências com as quais a soma aparece na caixa), e

  • ele ainda efetivamente modela um processo aleatório (porque os tickets ainda são retirados às cegas da caixa).

Dessa maneira, a soma pode ter simultaneamente um valor definido (fornecido pelas regras de adição aplicadas aos números em cada um dos tickets), enquanto a realização - que será um ticket retirado da caixa - não tem valor até é realizado.

Este modelo físico de retirada de bilhetes de uma caixa é adotado na literatura teórica e rigoroso com as definições de espaço amostral (a população), álgebras sigma (com suas medidas de probabilidade associadas) e variáveis ​​aleatórias como funções mensuráveis ​​definidas no espaço amostral. .

Esse relato de variáveis ​​aleatórias é elaborado, com exemplos realistas, em "O que se entende por uma variável aleatória?" .

whuber
fonte
3
+1 postagem exemplar. Espero que você não se importe com a pergunta impertinente, mas no que a ilustração foi feita?
Glen_b -Reinstate Monica
4
@Glen_b PowerPoint :-). A imagem de uma caixa é de mymiddlec.files.wordpress.com/2013/09/empty-box.jpg . Os ingressos são gráficos do PowerPoint. (Não há nada impertinente nessas questões!) Agrupei o grupo inteiro, colei no Paint e usei isso para salvá-lo como um arquivo .png.
whuber
Estou faltando alguma coisa, mas parece que você está apenas escrevendo vários rótulos numéricos em cada membro da população. Todos os alfas têm X = 1, Y = 2 e, portanto, X + Y = 3. X, Y e X + Y têm exatamente a mesma distribuição, deslocada por um valor aqui um valor ali, por causa de diferentes lebels
MiloMinderbinder
1
@ whuber - deveria ter frequências escritas. Não é bem versado em jargões matemáticos para dizer 'medida de probabilidade subjacente'. de qualquer forma, você está entendendo o meu desvio. Estou começando a ver como posso brincar com os números dos ingressos para obter a distribuição de probabilidade desejada. No nível superficial, essa abordagem parecia apenas um jogo de palavras com diferentes 'rótulos' e, portanto, não a via claramente. seria a 50ª vez que você me ajudaria neste site. obrigado
MiloMinderbinder 30/09
1
@Milo De nada. Vejo agora que você estava reagindo ao exemplo nesta resposta e não ao exemplo que dei nos comentários anteriores. O exemplo da resposta realmente tem três tickets diferentes com frequências relativas 1: 2: 3, e isso é tudo o que "medida de probabilidade" significa neste caso. Porém, isso não é apenas um jargão: há uma profunda necessidade dos conceitos subjacentes. Consulte, entre outros, stats.stackexchange.com/questions/199280 para obter algumas contas legais.
whuber
4

não existe segredo por trás dessa frase, é tão simples quanto você pode pensar: se X e Y são duas variáveis ​​aleatórias, sua soma é X + Y e essa soma também é uma variável aleatória. Se X_1, X_2, X_3, ..., X_n e são n variáveis ​​aleatórias, sua soma é X_1 + X_2 + X_3 + ... + X_n e essa soma também é uma variável aleatória (e a realização dessa soma é uma única número, ou seja, uma soma de n realizações).

Por que você fala tanto sobre somas de variáveis ​​aleatórias na classe? Uma razão é o (incrível) teorema do limite central: se somarmos muitas variáveis ​​aleatórias independentes, poderemos "prever" a distribuição dessa soma (quase) independentemente da distribuição das variáveis ​​únicas na soma! A soma tende a se tornar uma distribuição normal e essa é a provável razão pela qual observamos a distribuição normal com tanta frequência no mundo real.

jolvi
fonte
3

rv é uma relação entre a ocorrência de um evento e um número real. Digamos, se estiver chovendo, o valor X é 1, se não for 0. Você pode ter outro rv Y igual a 10 quando está frio e 100 quando está quente. Portanto, se estiver chovendo e fazendo frio, X = 1, Y = 10 e X + Y = 11.

Os valores X + Y são 10 (não chove frio); 11 (chovendo, frio), 100 (não chovendo, quente) e 110 (chovendo, quente). Se você descobrir nossas probabilidades dos eventos, obterá PMF desse novo rv X + Y.

Aksakal
fonte
1

X,YX+YΩ1×Ω2X,YΩ={Heumad,TumaEueu}X(Heumad)=Y(Heumad)=1,X(TumaEueu)=Y(TumaEueu)=0 0(X+Y)X,Yσ-X,Y

Daniel Li
fonte