Como aplicar redes neurais em problemas de classificação multi-label?

12

Descrição:

Permita que o domínio do problema seja uma classificação de documento onde exista um conjunto de vetores de recursos, cada um pertencendo a 1 ou mais classes. Por exemplo, um documento doc_1pode pertencer a Sportse Englishcategorias.

Questão:

Usando rede neural para classificação, qual seria o rótulo para um vetor de característica? seria um vetor constituído por todas as classes de tal forma que 0 valor seja atribuído a classes não relevantes e 1 para classes relevantes? Portanto, se a lista de rótulos de classe for [Sports, News, Action, English, Japanese], então, para o documento, doc_1o rótulo seria [1, 0, 0, 1, 0]?

Curioso
fonte

Respostas:

3

Sim, no aprendizado de vários rótulos, as informações do rótulo geralmente são codificadas como o vetor binário que você descreveu. Também é mais fácil para a avaliação.

Podemos querer verificar o MULAN , uma biblioteca Java de código aberto para aprendizado de vários rótulos. É uma extensão Weka e implementou muitos classificadores de vários rótulos, incluindo redes neurais. Por exemplo, você pode encontrar o BP-MLL aqui .

Weiwei
fonte
8

Este parece ser o documento que você está procurando:

Min-Ling Zhang e Zhi-Hua Zhou: Redes Neurais de Rótulos Múltiplos com Aplicações à Genômica Funcional e à Categorização de Texto

Do resumo:

No aprendizado de vários rótulos, cada instância do conjunto de treinamento é associada a um conjunto de rótulos, e a tarefa é gerar um conjunto de rótulos cujo tamanho seja desconhecido a priori para cada instância invisível. maneira que um algoritmo de rede neural chamado BP-MLL, ou seja, Backpropagation for Multi-Label Learning, é proposto. ... As aplicações para dois problemas reais de aprendizagem de etiquetas múltiplas, ou seja, genômica funcional e categorização de texto, mostram que o desempenho do BP-MLL é superior aos de alguns algoritmos de aprendizagem de etiquetas múltiplas bem estabelecidos.

Steffen
fonte