Estou tentando entender o processo de restaurante chinês (CRP) e o processo de restaurante chinês ponderado (WCRP) descrito em um artigo de pesquisa "Descoberta automática de habilidades cognitivas" - Robert V. Lindsey, Mohammad Khajah, Michael C. Mozer para melhorar a previsão de Aprendizagem do aluno. No CRP, todas as implementações (cf., modelos de mistura infinita com Bayes não paramétrico e o processo Dirichlet ) têm uma comparação feita com o número aleatório para decidir se o cliente escolhe sentar-se em uma tabela nova ou existente. Por que essa verificação é feita e também como essa condição de verificação será diferente no WCRP?
clustering
nonparametric-bayes
Nakshu
fonte
fonte
Respostas:
Essa implementação está usando a representação da Polya no processo Dirichlet, como descrito por Blackwell e MacQueen (1973). No link que você forneceu, essa parte específica do processo é descrita como "Com probabilidade α / (1 + α), ele se senta em uma nova mesa". Conceitualmente, pode-se pensar nisso como capturando a idéia de que, em princípio, há um número infinito de tabelas possíveis para ingressar.
A única diferença em um processo de restaurante chinês ponderado em termos de verificação de número aleatório é a probabilidade de decidir iniciar uma nova tabela (cluster) será diferente.
fonte
O CRP é um modelo usado com modelos gráficos para simular quantos clusters você possui.
Não é aplicado aos pontos de dados. De fato, é um prior e não depende dos dados.
fonte