A definição mais geral e abstrata de independência torna essa afirmação trivial, ao mesmo tempo em que fornece uma condição de qualificação importante: que duas variáveis aleatórias são independentes significa que as álgebras sigma que geram são independentes. Como a sigma-álgebra gerada por uma função mensurável de uma sigma-álgebra é uma sub-álgebra, a maioria das funções mensuráveis dessas variáveis aleatórias possui álgebras independentes, de onde essas funções são independentes.
(Quando uma função não é mensurável, geralmente não cria uma nova variável aleatória, portanto o conceito de independente nem se aplica.)
Vamos desembrulhar as definições para ver como isso é simples. Lembre-se de que uma variável aleatória é uma função com valor real definida no "espaço da amostra" (o conjunto de resultados que está sendo estudado por probabilidade).ΩXΩ
Uma variável aleatória é estudada por meio das probabilidades de que seu valor esteja dentro de vários intervalos de números reais (ou, de maneira mais geral, conjuntos construídos de maneira simples a partir de intervalos: esses são os conjuntos mensuráveis de números reais de Borel).X
Correspondente a qualquer Borel conjunto mensurável é o evento que consiste de todos os resultados para o qual mentiras em .X ∗ ( I ) ω X ( ω ) II X∗(I)ωX(ω)I
A sigma-álgebra gerada por é determinada pela coleção de todos esses eventos.X
A definição ingênua diz que duas variáveis aleatórias e são independentes "quando suas probabilidades se multiplicam". Ou seja, quando sou um conjunto mensurável de Borel e é outro, entãoY I JXYIJ
Pr(X(ω)∈I and Y(ω)∈J)=Pr(X(ω)∈I)Pr(Y(ω)∈J).
Mas na linguagem dos eventos (e das álgebras sigma) é o mesmo que
Pr ( ω ∈ X∗( Eu) e ω ∈ Y∗( J) ) = Pr ( ω ∈ X∗( Eu) ) Pr ( ω ∈ Y∗( J) ) .
Considere agora duas funções e suponha que e sejam variáveis aleatórias. (O círculo é composição funcional: . É o que significa para ser uma "função de uma variável aleatória".) é apenas a teoria dos conjuntos elementares - que f ∘ X g ∘ Y ( f ∘ X ) ( ω ) = f ( X ( ω ) ) ff, g: R → Rf∘ Xg∘ Y( f∘ X) ( ω ) = f( X( ω ) )f
( f∘ X)∗( Eu) = X∗( f∗( Eu) ) .
Em outras palavras, todo evento gerado por (que está à esquerda) é automaticamente um evento gerado porXf∘ XX (conforme exibido na forma do lado direito). Portanto (5) se aplica automaticamente a e : não há nada para verificar! f ∘ X g ∘ Yf∘ Xg∘ Y
NB Você pode substituir "valor real" em todos os lugares por "com valores em " sem precisar alterar mais nada de maneira material. Isso abrange o caso de variáveis aleatórias com valor vetorial.Rd
Considere esta prova "menos avançada":
Seja , onde são variáveis aleatórias independentes são funções mensuráveis. Então: Usando a independência de e , X , Y f , g P { f ( X ) ≤ x e g ( Y ) ≤ y }X: ΩX→ Rn, Y: ΩY→ Rm, f: Rn→ Rk, g: Rm→ Rp X, Y f, g XYP({X∈{w∈ R n :f(w)≤x}})
A idéia é perceber que o conjunto assim propriedades que são válidos para são estendidas para e o mesmo acontece para .X f ( X ) Y
fonte
Sim, e são independentes de qualquer funções e , desde que e são independentes. É um resultado muito conhecido, estudado em cursos de teoria das probabilidades. Tenho certeza que você pode encontrá-lo em qualquer texto padrão como o de Billingsley.h ( Y ) g h X Yg(X) h(Y) g h X Y
fonte
Não como uma alternativa, mas como uma adição às respostas brilhantes anteriores, observe que esse resultado é de fato muito intuitivo.
Geralmente, pensamos que e sendo independentes significa que conhecer o valor de não fornece informações sobre o valor de e vice-versa. Essa interpretação obviamente implica que você não pode "espremer" uma informação aplicando uma função (ou por qualquer outro meio).X Y X Y
fonte