Estou lendo o livro de reconhecimento de padrões e aprendizado de máquina de Chris Bishop . Encontrei o termo inferência probabilística várias vezes. Eu tenho algumas perguntas.
A inferência probabilística é aplicável apenas em um contexto de modelagem gráfica?
Qual é a distinção entre inferência estatística tradicional (valores de p, intervalos de confiança, fatores de Bayes etc.) e inferência probabilística?
Esse é um termo específico para a comunidade de CS ou também é amplamente usado na comunidade de estatísticas?
machine-learning
probability
inference
graphical-model
discretetimeisnice
fonte
fonte
Respostas:
A inferência probabilística usa modelos probabilísticos , isto é, modelos que descrevem os problemas estatísticos em termos de teoria das probabilidades e distribuições de probabilidades. Embora as estatísticas usem a teoria das probabilidades bastante, você não pode dizer que essas duas disciplinas são a mesma coisa (verifique a discussão neste tópico ). Observe que muitos métodos estatísticos e de aprendizado de máquina não usar explicitamente a teoria da probabilidade para definir os problemas, por exemplo, muitos algoritmos de agrupamento, ou métodos de classificação que o trabalho ao minimizar alguma função perda etc. Mas a distinção não é tão simples, tomar como exemplo a computação bayesiana aproximada - teoricamente, baseia-se na inferência bayesiana (probabilística!), mas lida com casos em que não temos função de probabilidade; portanto, em vez disso, usamos uma medida de distância.
fonte
Responderei às suas perguntas com base na minha experiência em aprender Modelos Gráficos Probabilísticos (PGM) na universidade e na maneira como meu professor de PGM definiu a inferência probabilística . Sabendo que o material desta classe foi baseado em [1], presumo que você possa encontrar respostas mais precisas neste livro.
Em resposta a 2: Inferência probabilística é um tipo de inferência estatística. De [2] e [3], a inferência estatística faz proposições estatísticas sobre uma população, incluindo estimativa de pontos , estimativa de intervalos , rejeição de hipóteses , agrupamento e classificação . A "inferência probabilística" foi introduzida e aproximadamente definida no contexto do PGM como qualquer tarefa de marginalização de uma função de probabilidade, seja uma computação de probabilidade marginal ou encontrando o resultado mais provável (por exemplo, classificação). Assim, entra na definição de inferência estatística como fazendo uma proposição sobre a distribuição de probabilidade subjacente da população.
Para ilustrar matematicamente algumas tarefas de marginalização no contexto do PGM, seja um conjunto de variáveis aleatórias. Para uma determinada rede bayesiana ou rede markoviana com , as seguintes rotinas são consideradas inferências probabilísticas :X={X1,…,Xn} (G,Pθ) (H,Pθ) Pθ
Calculando uma probabilidade marginal ou condicional: para , queremos responder:E,X⊂X Pθ(X=x∣E=e)= ?.
Realização mais provável: para , queremos responder:E,X⊂X argminxPθ(X=x∣E=e)= ?.
Em resposta a 1 e 3: foi a primeira vez que vi essa terminologia. O termo faz sentido, uma vez que você faz inferência sobre questões diretamente relacionadas às probabilidades. Não sei responder se é usado apenas no CS ou no contexto do PGM.
[1] Koller, Daphne e Nir Friedman. 2009. Modelos Gráficos Probabilísticos: Princípios e Técnicas. MIT Pressione.
[2] https://en.wikipedia.org/wiki/Statistical_inference
[3] https://encyclopediaofmath.org/wiki/Statistical_inference.
fonte