Digamos, é dependente de α . Rigorosamente falando,
se e α são variáveis aleatórias, poderíamos escrever p ( X ∣ α ) ;
no entanto, se é uma variável aleatória e α é um parâmetro, temos que escrever p ( X ; α ) .
Percebo várias vezes que a comunidade de aprendizado de máquina parece ignorar as diferenças e abusar dos termos.
Por exemplo, no famoso modelo LDA, em que é o parâmetro Dirichlet em vez de uma variável aleatória.
Não deveria ser ? Eu vejo muitas pessoas, incluindo os autores originais do artigo da LDA, escrevendo como p ( θ ∣ α ) .
machine-learning
terminology
Sibbs Gambling
fonte
fonte
Respostas:
Eu acho que isso é mais sobre estatísticas bayesianas / não bayesianas do que sobre machine learning vs .. estatísticas.
fonte