O que significa o termo "prior" em aprendizado de máquina

12

Eu sou novo no aprendizado de máquina. Eu li vários artigos em que eles empregaram aprendizado profundo para várias aplicações e usaram o termo "anterior" na maioria dos casos de design de modelo, digamos, antes no corpo humano. Alguém pode explicar o que isso realmente significa. Eu só consegui encontrar a formulação matemática de anterior e posterior nos tutoriais.

Amy
fonte
5
É um conceito matemático, portanto, sim, é formulado matematicamente. No entanto, a página da Wikipedia parece dar muita intuição. Você checou? Em caso afirmativo, você poderia dizer mais sobre o que não entendeu e o que procura em uma resposta?
David Richerby
@David Richerby . Obrigado pela sua resposta. Sim, eu verifiquei a página da Wikipedia e pude reunir uma vaga idéia de que é algo sobre conhecimento ou informação sobre uma variável. Eu estava lendo artigos sobre estimativa de pose corporal, onde havia menções de anteriores de pose corporal, anteriores de corpo cinemático, modelagem de anteriores sobre pose humana 3D, aprendizes anteriores, antes de estimar pose humana 3D. Eu não conseguia descobrir claramente o que o termo "anterior" realmente significa neste contexto.
Amy

Respostas:

13

Simplificando, e sem símbolos matemáticos, prior significa crenças iniciais sobre um evento em termos de distribuição de probabilidade . Você então configura um experimento e obtém alguns dados e, em seguida, "atualiza" sua crença (e, portanto, a distribuição de probabilidade) de acordo com o resultado do experimento (a distribuição de probabilidade a posteriori).

Exemplo: Suponha que recebemos duas moedas. Mas não sabemos qual moeda é falsa. A moeda 1 é imparcial (CABEÇAS e CAUDAS têm 50% de probabilidade) e a Moeda 2 é tendenciosa, digamos, sabemos que ela fornece CABEÇAS com probabilidade de 60%. Matematicamente:

Dado que temos HEADS, a probabilidade de que seja a Moeda 1 é de 0,4 e a probabilidade de que seja a Moeda 2 é de 0,6 p ( H | C o i n 2 ) = 0,6

p(H|CoEun1 1)=0,4
p(H|CoEun2)=0,6

Então, isso é tudo o que sabemos antes de iniciar um experimento.

Agora vamos pegar uma moeda e, com base nas informações que temos (H ou T), vamos adivinhar qual moeda escolhemos (Moeda 1 ou Moeda 2).

Inicialmente, assumimos que ambas as moedas têm chances iguais, porque ainda não temos informações. Este é o nosso prior . É uma distribuição uniforme .p(CoEun1 1)=p(CoEun2)=0,5

p(CoEun1 1|H)=p(H|CoEun1 1)p(CoEun1 1)p(H|CoEun1 1)p(CoEun1 1)+p(H|CoEun2)p(CoEun2)=0,4×0,50,4×0,5+0,6×0,5=0,4

p(CoEun2|H)=p(H|CoEun2)p(CoEun2)p(H|CoEun1 1)p(CoEun1 1)+p(H|CoEun2)p(CoEun2)=0,6×0,50,4×0,5+0,6×0,5=0,6

0,5

Esse é o princípio básico da inferência bayesiana e das estatísticas usadas no aprendizado de máquina.

fade2black
fonte
2
Você precisa corrigir o exemplo acima. Esse cálculo mostra que as duas moedas são tendenciosas (a primeira com prob de 40% e a segunda com probabilidades de 60%). = 5/11 e P (Coin2 | H) =
11/11
11
Deve "Dado Nós temos as cabeças, a probabilidade de que é Coin 1 é 0,4" ser reescrita como "Dado que temos Coin 1, a probabilidade de que é CABEÇAS é 0,4" ?
Mateen Ulhaq
A explicação não explica em termos de aprendizado de máquina.
user3023715 5/04