Alguém pode ajudar a explicar a diferença entre independente e aleatória?

21

Nas estatísticas, independente e aleatório descrevem as mesmas características? Qual a diferença entre eles? Geralmente encontramos a descrição como "duas variáveis ​​aleatórias independentes" ou "amostragem aleatória". Eu estou querendo saber qual é a diferença exata entre eles. Alguém pode explicar isso e dar alguns exemplos? por exemplo, processo não independente, mas aleatório?

tiantianchen
fonte
Aqui estão dois conceitos distintos (em um nível não muito profundo) mesclados. "Independente", no sentido, gerou observações independentemente e "variáveis ​​independentes" geraram suas distribuições.
ttnphns
3
Essa é uma pergunta estranha, porque se você consultasse definições formais de "variável aleatória" e "independente" - que é o que "em estatística" parece sugerir -, você descobriria que elas têm pouco em comum.
whuber
@ttnphns, Sim, acho que fiquei mais confuso sobre o termo "observações geradas independentemente" com "gerado aleatoriamente". Na amostragem, geralmente ouvimos amostragem aleatória (simples), o que me faz sentir como amostras independentes. Acho que se realmente queremos combinar as duas características na descrição de um método de amostragem, deve ser: a seleção de observações não depende umas das outras (= independentemente) e a probabilidade de seleção de uma observação é conhecida (= aleatoriamente)?
tiantianchen
1
Se verificarmos a definição de independência do wiki: "Na teoria das probabilidades, dois eventos são independentes, estatisticamente independentes ou estocticamente independentes se a ocorrência de um não afetar a probabilidade do outro.", A dependência de duas observações deve ser baseada sobre como eles são gerados / selecionados, e não como eles se parecem nos dados. Então as duas observações idênticas no caso que mencionei acima ainda devem ser independentes.
tiantianchen 24/08
2
Por favor, não confunda a explicação heurística no início de qualquer entrada da Wikipedia com uma definição. A definição é dada sob o título "definição" no mesmo artigo . É o que é oferecido na resposta de Tim aqui.
whuber

Respostas:

35

Vou tentar explicá-lo em termos não técnicos: Uma variável aleatória descreve o resultado de um experimento; você não pode saber antecipadamente qual será o resultado exato, mas possui algumas informações: sabe quais são os possíveis e sabe, para cada resultado, sua probabilidade.

Por exemplo, se você jogar uma moeda justa, não saberá com antecedência se conseguirá cara ou coroa, mas sabe que esses são os possíveis resultados e sabe que cada um tem 50% de chance de ocorrência.

Para explicar a independência, você deve jogar duas moedas justas. Depois de jogar a primeira moeda, você sabe que para a segunda jogada as probabilidades de cabeça ainda são de 50% e também de cauda. Se o primeiro sorteio não tem influência nas probabilidades do segundo, os dois sorteios são independentes. Se o primeiro sorteio tiver influência nas probabilidades do segundo sorteio, elas serão dependentes.

Um exemplo de jogadas dependentes é quando você cola as duas moedas.


fonte
3
Outro par de variáveis ​​dependentes seria "se você tem cara" e "se você tem coroa". Ambos são aleatórios, mas não são independentes um do outro.
user253751
3
@immibis Ou jogue um dado justo, anote o valor. depois role novamente e multiplique o valor pelo valor anotado. Este valor é aleatório, mas depende do primeiro lançamento.
Crowley
8

Aleatório se refere à variável aleatória e independente se refere à independência probabilística. Por independência, queremos dizer que observar uma variável não nos diz nada sobre a outra, ou em termos mais formais, se e Y são duas variáveis ​​aleatórias, então dizemos que são independentes seXY

pX,Y(x,y)=pX(x)pY(y)

além disso

E(XY)=E(X)E(Y)

e sua covariância é zero. A variável aleatória depende de X se puder ser escrita como uma função de XYXX

Y=f(X)

Portanto, neste caso, é aleatório e depende de XYX .

Chamar o processo de "não independente" é bastante enganador - independente de quê? Eu acho que você quis dizer que existem algumas variáveis ​​aleatórias independentes e identicamente distribuídas (verifique aqui ou aquiX1,...,Xk ) que vêm de algum processo. Por independente, queremos dizer aqui que eles são independentes um do outro. Existem processos que produzem variáveis ​​aleatórias dependentes, por exemplo

XEu=XEu-1+ε

onde é algum ruído aleatório. Obviamente, nesse caso, X i é dependente X i - 1 , mas que também é aleatória.εXEuXEu-1

Tim
fonte
O que significa se X é uma variável aleatória? Acho que você está confundindo RVs e eventos: dois RVs X e Y são independentes se os eventos P ( X r ) e P ( Y s ) são independentes para todos os r, sP(X) P(Xr)P(Ys)
Matthew Towers
Então, quaisquer duas variáveis ​​aleatórias contínuas são independentes.
Matthew Towers
@m_t_ Realmente não acho que discutir a notação leve a lugar algum (veja, por exemplo, en.wikipedia.org/wiki/… )
Tim
2
@tiantianchen ao contrário: se você tiver variáveis ​​aleatórias de iid, poderá construir a função de probabilidade multiplicando os pdf individuais porque são independentes.
Tim
1

Variáveis ​​são usadas em todos os campos da matemática. As definições de independência e aleatoriedade de uma variável são aplicadas unilateralmente a todas as formas de matemática, não apenas às estatísticas.

Por exemplo, os eixos X e Y na geometria euclidiana bidimensional representam variáveis ​​independentes, no entanto, seus valores não são (geralmente) atribuídos aleatoriamente.

Duas variáveis ​​dadas podem ser aleatórias ou independentes (uma da outra), ou ambas, ou nenhuma. A estatística tende a focar na aleatoriedade (mais corretamente, na probabilidade), e se duas variáveis ​​são independentes ou não, pode ter muitas implicações para as probabilidades de determinados resultados serem observados.

Você tende a ver essas duas propriedades (independência e aleatoriedade) descritas juntas ao estudar estatística, porque ambas são importantes para conhecer e podem influenciar a resposta à pergunta em questão. No entanto, essas propriedades não são sinônimos e, em outros campos da matemática, elas não ocorrem necessariamente juntas.

Steve-O
fonte
Obrigado. Você pode explicar mais sobre "se duas variáveis ​​são independentes podem ter muitas implicações para as probabilidades de determinados resultados serem observados".
tiantianchen 24/08
3
Essa é uma resposta não estatística que aborda um sentido diferente de "independente" do que aquele usado na pergunta. Também confunde dois sentidos da "variável": um é o matemático e o outro é a definição estatística da variável aleatória (que definitivamente não é a mesma que as variáveis ​​nos eixos geométricos).
whuber
1

A noção de independência é relativa, enquanto você pode ser aleatório sozinho. No seu exemplo, você tem "duas variáveis ​​aleatórias independentes" e não precisa falar sobre várias "amostras aleatórias".

Suponha que você lance um dado perfeito várias vezes. O resultado é aleatório a priori. Conhecendo o passado, você não pode prever o número a seguir 4. Suponha que eu gere uma sequência do outro lado do dado: 6 1 , 3 4 . Eu recebo 1 , 2 , 4 , 2 , 3 . É tão aleatório quanto o primeiro. Você não pode adivinhar o que vem depois de 3 . Mas as duas sequências são completamente dependentes.6,5,3,5,461341,2,4,2,33

Se alguém lançar dois dados em paralelo (sem interações entre eles), suas respectivas seqüências serão aleatórias e independentes.

Laurent Duval
fonte
1
Isso pode ser um pouco técnico, dado o nível do OP, mas em relação à sua afirmação "Você não pode ser independente (de algo) sozinho (como um processo, uma sequência)" considere o seguinte: Qualquer variável aleatória X, que é igual a uma constante c com probabilidade um, é independente de "tudo", incluindo a si próprio. Ou seja, para um tal X, X é independente de X. Você pode facilmente verificar isso de acordo com a definição de independência.
Mark L. Stone
XXX
X é independente de si mesmo. Ou seja, X é independente de X.
Mark L. Stone
0

Quando você tem um par de valores quando o primeiro é gerado aleatoriamente e o segundo tem alguma dependência do primeiro. por exemplo, altura e peso de um homem. Existe correlação entre eles. Mas ambos são aleatórios.

scarabeus
fonte
Embora esta postagem use as palavras "aleatória" e "dependente", ela não as define nem as distingue claramente. De fato, parece sugerir que "aleatório = dependente"!
whuber
0

O exemplo da moeda é uma ótima ilustração de uma variável aleatória e independente; uma boa maneira de pensar em uma variável aleatória mas dependente seria a próxima carta retirada de um baralho de sete cartas de baralho, a probabilidade de qualquer resultado numérico específico. muda dependendo das cartas negociadas anteriormente, mas até que apenas um valor da carta permaneça no sapato, o valor da próxima carta permanecerá aleatório.

phantombread
fonte
3
Provavelmente vale a pena substituir a palavra "probabilidade" por "probabilidade" aqui, já que a probabilidade tem uma definição técnica em estatísticas
Silverfish
1
Uma probabilidade que depende de outros eventos (geralmente eventos anteriores, mas às vezes com base no conhecimento de eventos futuros ou simultâneos - na verdade não há direção temporal para isso) é chamada de probabilidade condicional . A palavra probabilidade é usada para se referir a um tipo de "probabilidade inversa" (ou no caso contínuo, uma densidade de probabilidade) - ou seja, calcula-se a probabilidade de um resultado (por exemplo, seus dados) condicional ao parâmetro (s) do seu modelo ), mas se pensarmos o contrário, é a probabilidade desse parâmetro, dados seus dados .
Silverfish
1
ππ=1/6
-1

David Bohm em seu trabalho Causality and Chance in Modern Physics (Londres: Routledge, 1957/1984) descreve causalidade, chance, aleatoriedade e independência:

"Na natureza, nada permanece constante. Tudo está em um estado perpétuo de transformação, movimento e mudança. No entanto, descobrimos que nada simplesmente surge do nada sem ter antecedentes que existiam antes. Da mesma forma, nada desaparece sem deixar vestígios, em a sensação de que isso não dá origem a absolutamente nada que existe mais tarde ... tudo vem de outras coisas e dá origem a outras coisas.Este princípio ainda não é uma afirmação da existência de causalidade na natureza. o próximo passo é observar que, ao estudarmos os processos que ocorrem sob uma ampla gama de condições, descobrimos que, dentro de toda a complexidade da mudança e transformação, existem relacionamentosque permanecem efetivamente constantes. .... Neste ponto, no entanto, encontramos um novo problema. Pois a necessidade de uma lei causal nunca é absoluta. Assim, vemos que é preciso conceber a lei da natureza como necessária somente se alguém abstrair de contingências , representando fatores essencialmente independentes que podem existir fora do escopo de coisas que podem ser tratadas pelas leis em consideração e que não seguem necessariamente de qualquer coisa que possa ser especificada no contexto dessas leis. Tais contingências levam ao acaso . "(Pp.1-2)

"A tendência de contingências fora de um determinado contexto flutuarem independentemente dos acontecimentos dentro desse contexto demonstrou ser tão difundida que se pode enunciá-la como um princípio; a saber, o princípio da aleatoriedade. Por aleatoriedade, entendemos exatamente que essa independência leva a à flutuação dessas contingências de uma maneira muito complicada em uma ampla gama de possibilidades, mas de maneira que as médias estatísticas tenham um comportamento regular e aproximadamente previsível ". (p.22)

noumenal
fonte
3
011/34/7
3
Você parece estar discutindo processos estocásticos (no tempo), em vez de aleatoriedade e variáveis ​​aleatórias.
whuber
4
Acredito que parte da dificuldade que estamos tendo na comunicação é que você parece estar pensando em "independente" no sentido de uma variável independente em regressão. Embora alguns elementos da pergunta possam sugerir isso, as frases "duas variáveis ​​aleatórias independentes" e "amostragem aleatória" indicam o contrário.
whuber
1
Não posso nem dizer qual é o seu entendimento, porque sua resposta não fornece definições. Estou tendo que adivinhar o que você está tentando dizer nos exemplos e descrições que você dá. Eles parecem diferir dos sentidos de "aleatório" e "independente" nos modos que descrevi nos comentários anteriores.
whuber
1
Eu adicionaria aos comentários @whuber que sua definição menciona variáveis ​​aleatórias que influenciam mutuamente pode ser enganosa. "Influência" é um termo muito forte que implica algum tipo de causalidade etc., enquanto a definição formal de independência não requer nenhuma causalidade ou influência, mas é simplesmente sobre relações de probabilidades conjuntas versus individuais.
Tim