Supervisão distante: supervisionada, semi-supervisionada ou ambas?

20

"Supervisão à distância" é um esquema de aprendizado no qual um classificador é aprendido, devido a um conjunto de treinamento pouco rotulado (os dados de treinamento são rotulados automaticamente com base em heurísticas / regras). Penso que tanto a aprendizagem supervisionada quanto a semi-supervisionada podem incluir essa "supervisão distante" se seus dados rotulados forem rotulados heuristicamente / automaticamente. No entanto, nesta página , "supervisão distante" é definida como "aprendizado semi-supervisionado" (isto é, limitado a "semi-supervisão").

Então, minha pergunta é: "supervisão distante" se refere exclusivamente à semi-supervisão? Na minha opinião, pode ser aplicado à aprendizagem supervisionada e semi-supervisionada. Forneça quaisquer referências confiáveis, se houver.

AM2
fonte

Respostas:

22

Um algoritmo de supervisão à distância geralmente possui as seguintes etapas:
1] Pode ter alguns dados de treinamento rotulados
2] Ele "tem" acesso a um conjunto de dados não rotulados
3] Possui um operador que permite coletar esses dados não rotulados e rotulá-los e espera-se que esse operador seja barulhento em seus rótulos.
4] O algoritmo utiliza coletivamente os dados originais de treinamento rotulados, se houver, e esses novos dados ruidosamente rotulados para fornecer a saída final.

Agora, para responder sua pergunta, você e o site estão corretos. Você está olhando para a quarta etapa do algoritmo e percebe que na quarta etapa é possível usar qualquer algoritmo ao qual o usuário tenha acesso. Daí o seu argumento: "ele pode ser aplicado à aprendizagem supervisionada e semi-supervisionada" .

Considerando que o site está analisando todas as etapas de 1 a 4 coletivamente e observa que os dados rotulados ruidosamente são obtidos de um conjunto de dados não rotulados (com ou sem o uso de alguns dados de treinamento rotulados pré-existentes) e esse processo de obtenção de rótulos ruidosos é um componente essencial para qualquer algoritmo de supervisão distante, portanto é um algoritmo semi-supervisionado.

TenaliRaman
fonte