O que eles querem dizer quando dizem "variável aleatória"?
69
O que eles querem dizer quando dizem "variável aleatória"?
Uma variável aleatória é uma variável cujo valor depende de eventos desconhecidos. Podemos resumir os eventos desconhecidos como "estado" e, em seguida, a variável aleatória é uma função do estado.
Exemplo:
Suponha que tenhamos três jogadas de dados ( , D 2 , D 3 ). Então o estado S = ( D 1 , D 2 , D 3 ) .
a sample
, que pedi para distinguir dos resultados . Por que você precisa introduzir uma função e chamá-la de variável aleatória, embora seja absolutamente determinística e não seja variável? Por que você não pode provar o resultado imediatamente?Introdução
Ao pensar em um comentário recente, noto que todas as respostas até agora sofrem com o uso de termos indefinidos como "variável" e termos vagos como "desconhecido", ou recorrem a conceitos matemáticos técnicos como "função" e "espaço de probabilidade". O que devemos dizer à pessoa não matemática que gostaria de uma definição clara, intuitiva e precisa de "variável aleatória"? Após algumas preliminares descrevendo um modelo simples de fenômeno aleatório, forneço uma definição que seja curta o suficiente para caber em uma linha. Como ele pode não satisfazer completamente os cognoscentos , explica depois como estender isso para a definição técnica usual.
Bilhetes numa caixa
Uma maneira de abordar a idéia por trás de uma variável aleatória é apelar para o modelo de aleatoriedade tickets-in-a-box . Este modelo substitui um experimento ou observação por uma caixa cheia de tickets. Em cada ticket está escrito um possível resultado do experimento. (Um resultado pode ser tão simples quanto "cara" ou "coroa", mas, na prática, é algo mais complexo, como histórico de preços das ações, registro completo de uma longa experiência ou a sequência de todas as palavras em um documento. .) Todos os resultados possíveis aparecem pelo menos uma vez entre os tickets; alguns resultados podem aparecer em muitos tickets.
Em vez de realmente conduzir o experimento, imaginamos misturar exaustivamente - mas cegamente - todos os tickets e selecionar apenas um. Se pudermos mostrar que o experimento real deve se comportar como se fosse conduzido dessa maneira, reduzimos um experimento do mundo real potencialmente complicado (e caro e demorado) a um experimento simples, intuitivo e de pensamento (ou "modelo estatístico"). "). A clareza e simplicidade oferecidas por este modelo tornam possível analisar o experimento.
Um exemplo
Exemplos padrão dizem respeito ao resultado de jogar moedas e dados e desenhar cartas de baralho. Isso é um pouco perturbador por sua trivialidade, para ilustrar, suponha que estamos preocupados com o resultado das eleições presidenciais dos EUA em 2016. Como uma (pequena) simplificação, assumirei que um dos dois principais partidos - republicano (R) ou Democrata (D) - vencerá. Como (com as informações atualmente disponíveis) o resultado é incerto, imaginamos colocar tickets em uma caixa: alguns com "R" escrito neles e outros com "D". Nosso modelo de resultado é sacar exatamente um ticket dessa caixa.
Falta alguma coisa: ainda não estipulamos quantos tíquetes haverá para cada resultado. De fato, descobrir isso é o principal problema da estatística: com base em observações (e teoria), o que pode ser dito sobre as proporções relativas de cada resultado na caixa?
(Espero que esteja claro que as proporções de cada tipo de ticket na caixa determinam suas propriedades, em vez dos números reais de cada ticket. As proporções são definidas - como sempre - como a contagem de cada tipo de ticket dividido por o número total de tickets.Por exemplo, uma caixa com um ticket "D" e um ticket "R" se comporta exatamente como uma caixa com um milhão de tickets "D" e um milhão de tickets "R", porque em ambos os casos cada tipo é 50% de todos os ingressos e, portanto, cada um tem 50% de chance de serem sorteados quando os ingressos estiverem completamente misturados.)
Tornando o modelo quantitativo
Mas não vamos prosseguir com essa questão aqui, porque estamos perto do nosso objetivo de definir uma variável aleatória. O problema com o modelo até agora é que ele não é quantificável, enquanto gostaríamos de poder responder a perguntas quantitativas com ele. E também não quero dizer perguntas triviais, mas questões práticas reais, como "se minha empresa investiu um bilhão de euros no desenvolvimento de combustíveis fósseis no mar dos EUA, quanto o valor desse investimento mudará como resultado das eleições de 2016?" ? " Nesse caso, o modelo é tão simples que não há muito que possamos fazer para obter uma resposta realista a essa pergunta, mas podemos chegar ao ponto de consultar nossa equipe econômica e pedir suas opiniões sobre os dois resultados possíveis:
Se os democratas vencerem, quanto mudará o investimento? (Suponha que a resposta seja dólares.)d
Se os republicanos vencerem, quanto isso mudará? (Suponha que a resposta é dólares.)r
As respostas são números. Para usá-los no modelo, pedirei à minha equipe que repasse todos os tickets na caixa e em cada ticket "D" para escrever " dollar" e em cada ticket "R" para escrever " r dollar". Agora podemos modelar a incerteza no investimento de maneira clara e quantitativa: sua mudança de valor pós-eleitoral é a mesma que receber a quantia em dinheiro escrita em um único ticket sorteado aleatoriamente a partir desta caixa.d r
Esse modelo nos ajuda a responder perguntas adicionais sobre o investimento. Por exemplo, quão incertos devemos ser sobre o valor do investimento ? Embora existam fórmulas matemáticas (simples) para essa incerteza, poderíamos reproduzir suas respostas razoavelmente com precisão apenas usando nosso modelo repetidamente - talvez mil vezes - para ver que tipos de resultados realmente ocorrem e medir sua propagação. Um modelo de tickets-in-a-box fornece uma maneira de raciocinar quantitativamente sobre resultados incertos.
Variáveis aleatórias
Para obter respostas quantitativas sobre fenômenos incertos ou variáveis, podemos adotar um modelo de ticket-in-a-box e escrever números nos tickets. Esse processo de escrever números deve seguir apenas uma regra: deve ser consistente. No exemplo, todo ingresso democrata precisa ter " dólares" - sem exceções - e todo ingresso republicano deve ter " r dólares" escritos.d r
Uma variável aleatória é qualquer maneira consistente de escrever números em tickets em uma caixa.
(A notação matemática para isso é dar um nome ao processo de renumeração, geralmente com uma letra maiúscula em latim como ou Y. As informações de identificação escritas nos tickets geralmente são nomeadas com letras minúsculas, geralmente ω ("omega" em minúscula) O valor associado por meio da variável aleatória X ao ticket ω é denotado X ( ω ) . No exemplo, então, podemos dizer algo como " X é uma variável aleatória que representa a mudança no valor do investimento". seria totalmente especificado, declarando X ( D ) =X Y ω X ω X( ω ) X e X ( R ) = r . Em casos mais complicados, os valores de X são dados por descrições mais complicadas e, freqüentemente, por fórmulas. Por exemplo, os tickets podem representar o valor de um ano dos preços de fechamento de uma ação e a variável aleatória X pode ser o valor em um determinado momento de algum derivado dessa ação, como uma opção de venda. O contrato de opção descreve como o X é calculado. Os comerciantes de opções usam exatamente esse tipo de modelo para precificar seus produtos.)X( D ) = d X( R ) = r X X X
Você notou que esse não é aleatório nem variável? Nem é "incerto" ou "desconhecido". É uma atribuição definida (de números a resultados), algo que podemos escrever com pleno conhecimento e total certeza. O que é aleatório é o processo de retirada de um ticket da caixa; o que é variável é o valor do ticket que pode ser sacado.X
Observe também a separação clara de duas questões diferentes envolvidas na avaliação do investimento: pedi aos economistas que determinassem para mim, mas não opinassem sobre o resultado da eleição. Usarei outras informações (talvez chamando consultores políticos, astrólogos, usando um quadro Ouija ou qualquer outra coisa) para estimar as proporções de cada um dos tickets "D" e "R" para colocar na caixa.X
Depois: sobre mensurabilidade
Quando a definição de variável aleatória é acompanhada da advertência "mensurável", o que o definidor tem em mente é uma generalização do modelo tickets-in-a-box para situações com infinitos resultados possíveis. (Tecnicamente, é necessário apenas com resultados incontáveis infinitos ou onde probabilidades irracionais estão envolvidas, e mesmo neste último caso pode ser evitado.) Com infinitos resultados, é difícil dizer qual seria a proporção do total. Se houver infinitamente muitos tickets "D" e infinitamente muitos tickets "R", quais são suas proporções relativas? Não podemos descobrir com uma mera divisão de um infinito por outro!
Nesses casos, precisamos de uma maneira diferente de especificar as proporções. Um conjunto "mensurável" de tickets é qualquer coleção de tickets na caixa para a qual sua proporção possa ser definida. Quando isso é feito, o número que pensamos como uma "proporção" é chamado de "probabilidade". (Nem toda coleção de tickets precisa ter uma probabilidade associada a ele.)
fonte
Informalmente, uma variável aleatória é uma maneira de atribuir um código numérico a cada resultado possível. *
Exemplo 1
Exemplo 2
No bridge, um ás vale 4 pontos altos da carta, um rei 3, uma rainha 2 e um valete 1. Qualquer outra carta vale 0 pontos.
* Formalmente, uma variável aleatória é uma função que mapeia cada resultado (no espaço de amostra) para um número real.
fonte
Ao contrário de uma variável regular, uma variável aleatória não pode ser substituída por um valor único e imutável. Em vez disso, propriedades estatísticas , como a distribuição da variável aleatória, podem ser declaradas. A distribuição é uma função que fornece a probabilidade de a variável assumir um determinado valor ou cair dentro de um intervalo, devido a determinados parâmetros, como média ou desvio padrão.
Variáveis aleatórias podem ser classificadas como discretas se a distribuição descrever valores de um conjunto contável, como números inteiros. A outra classificação para uma variável aleatória é contínua e é usada se a distribuição cobrir valores de um conjunto incontável, como números reais.
fonte
Foi-me contada esta história:
Da mesma maneira, uma Variável Aleatória não é aleatória, nem uma variável. É apenas uma função. (a história foi contada aqui: fonte ).
Esta é pelo menos uma maneira rápida de explicar, o que pode ajudar as pessoas a se lembrarem!
fonte
Da Wikipedia :
Do cnx.org :
fonte
Uma variável aleatória, geralmente denominada X, é uma variável em que o resultado é incerto. A observação de um resultado específico dessa variável é chamada de realização. Mais concretamente, é uma função que mapeia um espaço de probabilidade em um espaço mensurável, geralmente chamado de espaço de estado. As variáveis aleatórias são discretas (podem levar vários valores distintos) ou contínuas (podem levar um número infinito de valores).
Considere a variável aleatória X, que é o total obtido ao jogar dois dados. Pode levar qualquer um dos valores de 2 a 12 (com probabilidade igual dada dado justo) e o resultado é incerto até que o dado seja lançado.
fonte
Nos meus estudos universitários não matemáticos, fomos informados de que a variável aleatória é um mapa dos valores que a variável pode levar para as probabilidades. Isso permitiu desenhar as distribuições de probabilidade
Recentemente, percebi o quanto isso é diferente do que os matemáticos têm em mente. Acontece que, pela variável aleatória, eles significam uma função simples X: R → R, que pega um elemento do espaço de amostra Ω ( também conhecido como resultado, ticket ou indivíduo , conforme explicado acima) e o converte em um número real R no intervalo ( -∞, ∞). Ou seja, foi apropriadamente observado acima que não é aleatório e nem variável. A aleatoriedade geralmente vem com a medida de probabilidade P, como parte do espaço de medida (Ω, P). P mapeia amostras para R, de forma semelhante à variável aleatória, mas esse intervalo de tempo é limitado a [0,1] e podemos dizer que a variável aleatória se traduz (Ω, P) em (R, P), portanto, a variável aleatória é equipada com probabilidade meça P: R -> [0,1] para que você possa dizer para cada x em R qual é a probabilidade de sua ocorrência.
integral não precisa de nenhum valor real da variável aleatória.
fonte