Como você explicaria o iid (independente e identicamente distribuído) a pessoas não técnicas?
random-variable
intuition
user333
fonte
fonte
Explicação não técnica:
Independência é uma noção muito geral. Dizem que dois eventos são independentes se a ocorrência de um não fornecer informações sobre se o outro evento ocorreu ou não. Em particular, a probabilidade de atribuirmos ao segundo evento não é afetada pelo conhecimento de que o primeiro evento ocorreu.
Exemplo de eventos independentes, possivelmente distribuídos de forma idêntica
Considere jogar duas moedas diferentes uma após a outra. Supondo que o seu polegar não tenha se cansado demais quando ele jogou a primeira moeda, é razoável supor que saber que o primeiro lançamento da moeda resultou em Heads de forma alguma influencia a probabilidade de você pensar que a probabilidade de Heads no segundo lançamento é. Os dois eventos são eventos independentes .
Se soubermos, ou insistirmos obstinadamente, que as duas moedas têm probabilidades diferentes de resultar em Chefes, os eventos não serão distribuídos de forma idêntica.
Se soubermos ou assumirmos que as duas moedas têm a mesma probabilidade de aparecer, então os eventos acima também são distribuídos de forma idêntica, o que significa que ambos têm a mesma probabilidade de ocorrer. Mas observe que, a menos que , a probabilidade de Heads não seja igual à probabilidade de Tails. Conforme observado em um dos Comentários, "distribuição idêntica" não é o mesmo que "igualmente provável".p p = 1p p p=12
Exemplo de eventos não-independentes distribuídos de forma idêntica
Considere uma urna com duas bolas, uma preta e uma branca. Nós alcançamos e extraímos as duas bolas uma após a outra, escolhendo a primeira aleatoriamente (e isso, é claro, determina a cor da próxima bola). Assim, os dois resultados igualmente prováveis do experimento são (Branco, Preto) e (Preto, Branco), e vemos que a primeira bola tem a mesma probabilidade de ser Preta ou Branca e a segunda bola também tem a mesma probabilidade de ser Preta. ou branco. Em outras palavras, os eventos certamente são distribuídos de forma idêntica, mas são definitivamente não1
fonte
Uma variável aleatória é uma variável que contém a probabilidade de todos os eventos possíveis em um cenário. Por exemplo, vamos criar uma variável aleatória que represente o número de caras em 100 lançamentos de moedas. A variável aleatória conterá a probabilidade de obter 1 cabeça, 2 cabeças, 3 cabeças ..... até 100 cabeças. Vamos chamar esta variável aleatória X .
Se você tiver duas variáveis aleatórias, elas serão IID (independentes identicamente distribuídas) se:
Nota lateral: Independência também significa que você pode multiplicar probabilidades. Digamos que a probabilidade de cabeças é p, então a probabilidade de obter duas cabeças seguidas é p * p ou p ^ 2.
fonte
Que duas variáveis dependentes podem ter a mesma distribuição pode ser mostrada com este exemplo:
Suponha duas experiências sucessivas envolvendo cada 100 lançamentos de uma moeda tendenciosa, em que o número total de Head é modelado como uma variável aleatória X1 para o primeiro experimento e X2 para o segundo experimento. X1 e X2 são variáveis aleatórias binomiais com os parâmetros 100 ep, onde p é o viés da moeda.
Como tal, eles são distribuídos de forma idêntica. No entanto, eles não são independentes, uma vez que o valor do primeiro é bastante informativo sobre o valor do último. Ou seja, se o resultado do primeiro experimento for 100 cabeças, isso nos diz muito sobre o viés da moeda e, portanto, nos fornece muitas informações novas sobre a distribuição de X2.
Ainda X2 e X1 são distribuídos de forma idêntica, pois são derivados da mesma moeda.
O que também é verdade é que, se duas variáveis aleatórias são dependentes, o posterior de X2, dado X1, nunca será o mesmo que o anterior de X2 e vice-versa. Enquanto quando X1 e X2 são independentes, os posteriores são iguais aos anteriores. Portanto, quando duas variáveis são dependentes, a observação de uma delas resulta em estimativas revisadas quanto à distribuição da segunda. Ainda assim, ambos podem ser da mesma distribuição, é apenas que aprendemos no processo mais sobre a natureza dessa distribuição. Portanto, voltando às experiências de sorteio, inicialmente na ausência de qualquer informação, podemos assumir que X1 e X2 seguem uma distribuição binomial com os parâmetros 100 e 0,5. Mas depois de observar 100 cabeças seguidas, certamente revisaríamos nossa estimativa sobre o parâmetro p para torná-lo bem próximo de 1.
fonte
Uma agregação de vários sorteios aleatórios da mesma distribuição. Um exemplo é puxar um mármore da sacola 10.000 vezes e contar as vezes em que você puxa o mármore vermelho.
fonte
No entanto, ser distribuído de forma idêntica não implica necessariamente independência.
fonte