Qual é a intuição por trás da fórmula para probabilidade condicional?

30

A fórmula para a probabilidade condicional de acontecer, dado que aconteceu é:UMAB

P(A | B)=P(AB)P(B).

Meu livro explica a intuição por trás disso em termos de um diagrama de Venn.

insira a descrição da imagem aqui

Dado que ocorreu , a única maneira de ocorrer é que o evento caia na interseção de e .BAUMAB

Nesse caso, a probabilidade de seria simplesmente igual à probabilidade de interseção , pois essa é a única maneira que o evento pode acontecer? o que estou perdendo?P(A|B)AB

WorldGov
fonte
7
Você tem uma compreensão intuitiva do que é a probabilidade condicional, se esquecermos por um tempo como calculá-lo?
Juho Kokkala
4
Ao condicionado em B (o evento que tenha ocorrido), você restringir o seu espaço de resultados de (todo o plano), apenas para B. Você se esquece de tudo o que está fora B. A probabilidade do evento A tem de ser medida em relação B, uma vez que a probabilidade é entre 0 e 1.Ω
Vladislavs Dovgalecs
11
Está faltando o fato de que a parte branca do círculo do Evento A não faz mais parte da população depois que você sabe que o Evento B ocorreu.
Monty Harder
4
As intuições não são exatas, nem são singulares; então, por que perguntar sobre a intuição exata (singular)? Uma intuição útil é suficiente, mas nem todas as sugestões serão úteis para todas as pessoas.
John Coleman

Respostas:

23

Uma boa intuição é dada que B ocorreu - com ou sem A - qual é a probabilidade de A? Ou seja, agora estamos no universo em que B ocorreu - o círculo direito completo. Nesse círculo, a probabilidade de A é a área de A interseção B dividida pela área do círculo.

user0
fonte
5
Em outras palavras - digo que aconteceu, o que significa que vivemos no círculoDentro desse mundo, qual% de eventos estão na lente ( )? B A BBBAB
MichaelChirico
18

Eu pensaria assim: presumo que você entenda a intuição até:

Dado que B ocorreu, a única maneira de A ocorrer é que o mesmo caia na interseção de A e B.

e vou comentar a segunda imagem que você postou:

  1. Imagine que todo o retângulo branco seja o seu espaço de amostra .Ω

    Atribuir uma probabilidade a um conjunto significa que você está medindo em algum sentido esse conjunto. É o mesmo que se você medisse a área do retângulo, mas a probabilidade é de um tipo diferente de medida que possui propriedades específicas (não vou dizer mais nada sobre isso).

  2. Você sabe que e isso é interpretado assim:P(Ω)=1

    Ω representa todos os eventos que podem acontecer e algo precisa acontecer, por isso temos 100% de probabilidade de que algo aconteça.

  3. Analogamente o conjunto tem uma probabilidade que é proporcional à probabilidade do espaço amostra . Graficamente falando, você vê que portanto, a medida de (sua probabilidade ) deve ser menor que . O mesmo raciocínio é válido para o conjunto . Este conjunto pode ser medido e sua medida é .P ( A ) Ω Um Ω Um P ( O ) P ( Ω ) Um B P ( A B )AP(A)ΩAΩAP(A)P(Ω)ABP(AB)

  4. Se agora lhe disseram que aconteceu, você deve pensar como se fosse seu "novo" . Se é o seu "novo" então você pode ter 100% de certeza que tudo acontece no conjunto .BBΩBΩB

    E o que isso significa? Isso significa que agora, no "novo" concurso , é necessário redimensionar todas as medidas de probabilidade, levando em consideração que elas devem ser expressas em termos do "novo" espaço de amostra . É uma proporção simples.P(BB)=1B

    Sua intuição está quase certa quando você diz isso:

a probabilidade de P (A | B) seria simplesmente igual à probabilidade da interseção A

e o "quase" se deve ao fato de que agora seu espaço de amostra mudou (agora é ) e você deseja redimensionar acordo.BP(AB)

  1. P ( A B )P(AB) é o seu no novo mundo onde o espaço amostral é agora . Em palavras, você diria assim (e tente visualizá-lo na imagem com os conjuntos):P(AB)B

    No novo mundo, a razão entre a medida de e a medida de deve ser a mesma que a razão entre a medida de e a medida deA B Ω A BBABΩAB

  2. Por fim, traduza isso na linguagem matemática (uma proporção simples):

P(B):P(AB)=P(Ω):P(AB)

e desde , segue-se que:P(Ω)=1

P(AB)=P(AB):P(B)
Hard Core
fonte
5

Você verá a intuição pensando facilmente no seguinte problema.

Suponha que você tenha 10 bolas: 6 pretas e 4 vermelhas. Das bolas pretas 3 são impressionantes e das bolas vermelhas apenas 1 é impressionante. Qual a probabilidade de que uma bola preta também seja impressionante?

A resposta é muito fácil: são 50%, porque temos 3 bolas pretas incríveis do total de 6 bolas pretas.

É assim que você mapeia probabilidades para o nosso problema:

  • 3 bolas pretas e impressionantes correspondem aP(AB)
  • 6 bolas pretas correspondem aP(B)
  • probabilidade de uma bola ser impressionante quando SABEMOS que é preta:P(AB)
Aksakal
fonte
11
Não faria mais sentido escrever do que ? P ( B ) = 6n(B)=6P(B)=6
Silverfish 02/02
@Silverfish Seria mais preciso, mas eu estava depois da intuição, neste caso
Aksakal
4

Para uma intuição básica da fórmula de probabilidade condicional, eu sempre gosto de usar uma tabela de duas vias. Digamos que haja 150 alunos em um grupo de ano, dos quais 80 são mulheres e 70 homens, cada um dos quais deve estudar exatamente um curso de idioma. A tabela bidirecional de estudantes que fazem cursos diferentes é:

        | French   German   Italian  | Total
-------- --------------------------- -------
Male    |     30       20        20  |    70
Female  |     25       15        40  |    80
-------- --------------------------- -------
Total   |     55       35        60  |   150

Dado que um aluno faz o curso de italiano, qual é a probabilidade de ser do sexo feminino? Bem, o curso de italiano tem 60 alunos, dos quais 40 são mulheres que estudam italiano, então a probabilidade deve ser:

P(F|Italian)=n(FItalian)n(Italian)=4060=23

onde é a cardinalidade do conjunto , ou seja, o número de itens que ele contém. Observe que precisávamos usar no numerador e não apenas , porque o último teria incluído todas as 80 mulheres, incluindo as outras 40 quem não estuda italiano.A n ( F italiano ) n ( F )n(A)An(FItalian)n(F)

Mas se a pergunta foi trocada, qual é a probabilidade de um aluno fazer o curso de italiano, uma vez que é do sexo feminino? Em seguida, 40 das 80 alunas fazem o curso de italiano, então temos:

P(Italian|F)=n(ItalianF)n(F)=4080=12

Espero que isso forneça intuição por que

P(A|B)=n(AB)n(B)

Compreender por que a fração pode ser escrita com probabilidades em vez de cardinalidades é uma questão de frações equivalentes . Por exemplo, voltemos à probabilidade de um aluno ser do sexo feminino, pois estuda italiano. Existem 150 alunos no total, portanto, a probabilidade de um aluno ser mulher e estudar italiano é 40/150 (essa é uma probabilidade "conjunta") e a probabilidade de um aluno estudar italiano é 60/150 (essa é uma probabilidade "marginal" ) Observe que dividir a probabilidade conjunta pela probabilidade marginal fornece:

P(FItalian)P(Italian)=40/15060/150=4060=n(FItalian)n(Italian)=P(F|Italian)

(Para ver que as frações são equivalentes, multiplicar o numerador e o denominador por 150 remove o "/ 150" em cada um.)

De maneira mais geral, se o seu espaço de amostragem tiver cardinalidade - neste exemplo, a cardinalidade era 150 - descobrimos quen ( Ω )Ωn(Ω)

P(A|B)=n(AB)n(B)=n(AB)/n(Ω)n(B)/n(Ω)=P(AB)P(B)
Silverfish
fonte
3

Eu inverteria a lógica. A probabilidade de que e sejam:BAB

  1. A probabilidade aconteceu, e, dado que aconteceu.ABA
  2. Mesmas funções inversas para eBAB

Isso lhe dará

p(AB)=p(B)p(AB)

Se você está procurando um negativo para sua sugestão, é verdade que a probabilidade de dado está contida na probabilidade do produto, o espaço em que você está lançando os dados é menor que o espaço de probabilidade original - você sabe com certeza você está "em" , portanto, você divide pelo tamanho do novo espaço.B BABB

kabanus
fonte
2

O diagrama de Venn não representa probabilidade, representa a medida de subconjuntos do espaço de eventos. Uma probabilidade é a razão entre duas medidas; a probabilidade de X é o tamanho de "tudo o que constitui X" dividiu o tamanho de "todos os eventos considerados". Sempre que estiver calculando uma probabilidade, você precisará de um "espaço de sucesso" e um "espaço de população". Você não pode calcular uma probabilidade com base apenas em "quão grande" é o espaço de sucesso. Por exemplo, a probabilidade de rolar um sete com dois dados é o número de maneiras de rolar um sete dividido pelo número total de maneiras de rolar dois dados. Apenas conhecer o número de maneiras de rolar um sete não é suficiente para calcular a probabilidade. P (A | B) é a razão da medida do "ambos A e B acontecem" espaço e a medida do espaço "B acontece". Isso é o que o "|" significa: significa "tornar o que vem depois disso o espaço da população".

Acumulação
fonte
2

Eu acho que a melhor maneira de pensar sobre isso é desenhar caminhos passo a passo.

Vamos descrever o Evento B como rolar um em um dado justo - isso pode ser facilmente demonstrado com probabilidade . Agora vamos descrever o Evento A como sacar um Ás de um baralho de 52 cartas padrão - isso pode ser facilmente demonstrado com probabilidade .14 116113

Vamos agora fazer um experimento em que rolamos um dado e depois escolhemos uma carta. Então seria a probabilidade de desenharmos um Ás, já que já fizemos um . Se você olhar para a imagem, este seria o caminho (suba) e, em seguida, o caminho (suba novamente). 4 1P(A|B)4 116113

Intuitivamente, o espaço total de probabilidade é o que já temos: rolando o . Podemos ignorar o e o caminho inicial inicial leva a, pois foi dado D que fizemos o . Pela lei da multiplicação, nosso espaço total é então .14 12113 4(112134(16×113)+(16×1213)

Agora, qual é a probabilidade de termos um Ás, dado que obtivemos um ? A resposta usando o caminho é , que precisamos dividir pelo espaço total. Então temos( 14P(A(16×113)

P(A|B)=16×113(16×113)+(16×1213).

insira a descrição da imagem aqui

vítreo
fonte
2
Fiquei me perguntando para que serve o voto negativo, porque as árvores de probabilidade podem ser muito instrutivas. Talvez a preocupação seja que o uso de eventos independentes para a ilustração perca o próprio ponto de probabilidade condicional, que é que a distribuição de probabilidade pode mudar dependendo do evento de condicionamento. Usar uma ilustração menos superficial pode ajudar.
whuber
1

Pense nisso em termos de contagem. Probabilidade marginal é quantas vezes A ocorreu dividido pelo tamanho da amostra. A probabilidade conjunta de A e B é quantas vezes A ocorreu junto com B dividido pelo tamanho da amostra. A probabilidade condicional de A dado B é quantas vezes A ocorreu juntamente com B dividido por quantas vezes B ocorreu, ou seja, apenas os A's "dentro" de B's.

Você pode encontrar uma boa ilustração visual neste blog , que mostra usando blocos de Lego.

Tim
fonte
1

No momento em que escrevo, existem cerca de 10 respostas que parecem não entender o ponto mais importante: você está essencialmente certo.

Nesse caso, a probabilidade de P (A | B) não seria simplesmente igual à probabilidade da interseção A, pois essa é a única maneira de o evento acontecer?

Isso é definitivamente verdade. Isso explica por que a quantidade que definimos é realmente redimensionada.P ( A B )P(A|B)P(AB)

o que estou perdendo?

Você está sentindo falta de que a probabilidade de B ser satisfeito, uma vez que B seja satisfeito, seja 1, pois esse é um evento bastante certo, e não que pode muito bem ser menor que 1. Dividindo por torna a probabilidade condicional de B dada B igual a 1, como esperado. Na verdade, isso é ainda melhor e torna o mapa uma probabilidade - portanto, uma probabilidade condicional é realmente uma probabilidade.P(BB)=P(B)P(B)AP(A|B)

Michael Le Barbier Grünewald
fonte
0

Eu sinto que é mais intuitivo quando temos dados concretos para estimar as probabilidades.

Vamos usar os mtcarsdados como exemplo, os dados são assim (usamos apenas o número de cilindros e o tipo de transmissão).

> mtcars[,c("am","cyl")]
                    am cyl
Mazda RX4            1   6
Mazda RX4 Wag        1   6
Datsun 710           1   4
Hornet 4 Drive       0   6
...  
...
Ford Pantera L       1   8
Ferrari Dino         1   6
Maserati Bora        1   8
Volvo 142E           1   4

Podemos calcular a distribuição conjunta de duas variáveis ​​fazendo uma tabela cruzada:

> prop.table(table(mtcars$cyl,mtcars$am))

          0       1
  4 0.09375 0.25000
  6 0.12500 0.09375
  8 0.37500 0.06250

A probabilidade conjunta significa que queremos considerar duas variáveis ​​ao mesmo tempo. Por exemplo, perguntaremos quantos carros são de 4 cilindros e transmissão manual.

Agora, chegamos à probabilidade condicional. Eu descobri que a maneira mais intuitiva de explicar a probabilidade condicional é usar o termo filtragem em dados.

Suponha que desejemos obter , faremos as seguintes estimativas:P(am=1|cyl=4)

> cyl_4_cars=subset(mtcars, cyl==4)
> prop.table(table(cyl_4_cars$am))

        0         1 
0.2727273 0.7272727 

Isso significa que só cuidamos de carros com 4 cilindros. Então, nós filtramos dados sobre isso. Após a filtragem, verificamos quantas delas são de transmissão manual.

Você pode comparar isso condicional com a articulação que mencionei anteriormente para sentir as diferenças.

Haitao Du
fonte
0

Se Afosse um superconjunto da Bprobabilidade de que isso Aacontece, é sempre 1 dado o que Baconteceu, ou seja P(A|B) = 1. No entanto, Bele próprio pode ter uma probabilidade muito menor que 1.

Considere o seguinte exemplo:

  • dado xé um número natural em 1..100,
  • Aé ' xé um número par'
  • Bé ' xé divisível por 10'

então temos:

  • P(A) é 0,5
  • P(B) é 0,1

Se sabemos que xé divisível por 10 (ie xestá em B), sabemos que também é um número par (ie xestá em A) P(A|B) = 1.

Da regra de Bayes, temos:

P(A|B)=P(AB)P(B)

P(AB)xxP(AB)=P(B)P(A|B)=P(B)/P(B)=1


Para um exemplo não degenerado, considere, por exemplo, Ais ' xé divisível por 7' e Bis ' xé divisível por 3'. Então P(A|B)é equivalente a "dado que sabemos que xé divisível por 3, qual é a probabilidade de ser (também) divisível por 7?". Ou, equivalentemente, 'Que fração dos números 3, 6, ..., 99 é divisível por 7'?

Andre Holzner
fonte
0

Acho que sua afirmação inicial pode ser um mal-entendido.

Você escreveu:

A fórmula para a probabilidade condicional de A acontecer, uma vez que B aconteceu, é:

Do seu fraseado, pode parecer que existem 2 eventos "Primeiro B aconteceu, e depois queremos calcular a probabilidade de que A aconteça".

Este não é o caso. (O seguinte é válido se houve um mal-entendido ou não).

Temos apenas 1 evento, descrito por uma das 4 possibilidades:

  1. UMAB

  2. UMAB

  3. BUMA

  4. UMAB

P(UMA)=0,5,P(B)=0,5,eA e B são independentes.

P(A e B)=0,25eP(nem A nem B)=0,25.

P(AB)=0.25

BP(AB)P(B)ABP(A|B)0.50.25B

user985366
fonte
0

A probabilidade de condicionamento NÃO é igual à probabilidade de interseção. Aqui está uma resposta intuitiva:

P(BA)AB

P(AB)AB

A

Começando com a probabilidade do segundo, podemos deduzir a probabilidade do primeiro.

AB

ABA

BAB

0.5

P(AB)=1/2P(A(BA))+1/2P(B(AB))

ABA

P(AB)=P(A)P(BA)

Tadaaa ... agora isole a probabilidade do condicionamento!

btw. Eu adoraria se alguém pudesse explicar por que os cenários 1 e 2 são iguais. A chave está aí imo.

OBIEK
fonte