Na minha classe de probabilidade, os termos "somas de variáveis aleatórias" são constantemente usados. No entanto, estou preso no que exatamente isso significa?
Estamos falando da soma de várias realizações de uma variável aleatória? Se sim, isso não soma um único número? Como uma soma de realizações de variáveis aleatórias nos leva a uma distribuição ou a uma função cdf / pdf / de qualquer tipo? E se não são realizações de variáveis aleatórias, o que exatamente está sendo adicionado?
Respostas:
Um modelo físico e intuitivo de uma variável aleatória é escrever o nome de cada membro de uma população em um ou mais pedaços de papel - "ingressos" - e colocar esses ingressos em uma caixa. O processo de misturar completamente o conteúdo da caixa, seguido de retirar cegamente um bilhete - exatamente como em uma loteria - modela a aleatoriedade. As probabilidades não uniformes são modeladas através da introdução de números variáveis de tickets na caixa: mais tickets para os membros mais prováveis, menos para os menos prováveis.
Uma variável aleatória é um número associado a cada membro da população. (Portanto, para maior consistência, cada ticket de um determinado membro deve ter o mesmo número gravado nele.) Várias variáveis aleatórias são modeladas reservando espaços nos tickets para mais de um número. Costumamos dar a esses espaços nomes como Y , e Z . A soma dessas variáveis aleatórias é a soma usual: reserve um novo espaço em cada ticket para a soma, leia os valores de etc. em cada ticket e escreva sua soma nesse novo espaço. Essa é uma maneira consistente de escrever números nos tickets, por isso é outra variável aleatória.X, Y, Z Y ,X, Y,
Esta figura retrata uma caixa representando uma população e três variáveis aleatórias X , Y , e X + Y . Ele contém seis passagens: da três para α (azul) dão uma probabilidade de 3 / 6 , os dois para β (amarelo) dão uma probabilidade de 2 / 6 , e o outro para γ (verde) dão uma probabilidade de 1 / 6Ω = { α , β, γ} X Y X+ Y α 3 / 6 β 2 / 6 γ 1 / 6 . Para exibir o que está escrito nos tickets, eles são mostrados antes de serem misturados.
A beleza dessa abordagem é que todas as partes paradoxais da pergunta estão corretas:
a soma das variáveis aleatórias é de fato um número único e definido (para cada membro da população),
no entanto, também leva a uma distribuição (dada pelas frequências com as quais a soma aparece na caixa), e
ele ainda efetivamente modela um processo aleatório (porque os tickets ainda são retirados às cegas da caixa).
Dessa maneira, a soma pode ter simultaneamente um valor definido (fornecido pelas regras de adição aplicadas aos números em cada um dos tickets), enquanto a realização - que será um ticket retirado da caixa - não tem valor até é realizado.
Este modelo físico de retirada de bilhetes de uma caixa é adotado na literatura teórica e rigoroso com as definições de espaço amostral (a população), álgebras sigma (com suas medidas de probabilidade associadas) e variáveis aleatórias como funções mensuráveis definidas no espaço amostral. .
Esse relato de variáveis aleatórias é elaborado, com exemplos realistas, em "O que se entende por uma variável aleatória?" .
fonte
não existe segredo por trás dessa frase, é tão simples quanto você pode pensar: se X e Y são duas variáveis aleatórias, sua soma é X + Y e essa soma também é uma variável aleatória. Se X_1, X_2, X_3, ..., X_n e são n variáveis aleatórias, sua soma é X_1 + X_2 + X_3 + ... + X_n e essa soma também é uma variável aleatória (e a realização dessa soma é uma única número, ou seja, uma soma de n realizações).
Por que você fala tanto sobre somas de variáveis aleatórias na classe? Uma razão é o (incrível) teorema do limite central: se somarmos muitas variáveis aleatórias independentes, poderemos "prever" a distribuição dessa soma (quase) independentemente da distribuição das variáveis únicas na soma! A soma tende a se tornar uma distribuição normal e essa é a provável razão pela qual observamos a distribuição normal com tanta frequência no mundo real.
fonte
rv é uma relação entre a ocorrência de um evento e um número real. Digamos, se estiver chovendo, o valor X é 1, se não for 0. Você pode ter outro rv Y igual a 10 quando está frio e 100 quando está quente. Portanto, se estiver chovendo e fazendo frio, X = 1, Y = 10 e X + Y = 11.
Os valores X + Y são 10 (não chove frio); 11 (chovendo, frio), 100 (não chovendo, quente) e 110 (chovendo, quente). Se você descobrir nossas probabilidades dos eventos, obterá PMF desse novo rv X + Y.
fonte
fonte