Existe uma metodologia existente para aplicar um modelo de aprendizado supervisionado a um conjunto de dados incerto? Por exemplo, digamos que temos um conjunto de dados com as classes A e B:
+----------+----------+-------+-----------+
| FeatureA | FeatureB | Label | Certainty |
+----------+----------+-------+-----------+
| 2 | 3 | A | 50% |
| 3 | 1 | B | 80% |
| 1 | 1 | A | 100% |
+----------+----------+-------+-----------+
Como podemos treinar um modelo de aprendizado de máquina nisso? Obrigado.
machine-learning
supervised-learning
hyperdo
fonte
fonte
Em vez de ter os rótulos A ou B, você pode substituí-los por valores contínuos de certeza - por exemplo, corresponde a algo que você tem certeza de que é , corresponde a algo que você tem certeza de que é e corresponde a algo que você 're 40% de certeza é . Em seguida, tenha um modelo que, em vez de prever as classes ou produza uma pontuação entre e base no quanto você acha que é uma ou outra (e limite essa pontuação com base em se é> ou <1/2). Isso transforma seu problema de classificação em um problema de regressão (que você limita para retornar a um classificador).A 0 B 0,6 A A B 0 11 UMA 0 0 B 0.6 A A B 0 1
Por exemplo, você pode ajustar um modelo linear para como (onde é a certeza acima). Então, quando você quiser testar alguns dados, conecte-os ao modelo e, em seguida, rótulo se e caso contrário. β0+β T 1 xp(A|x)Aβ0+β T 1 x>0Blogp(A|x)p(B|x)=logp(A|x)1−P(A|x) β0+βT1x p(A|x) A β0+βT1x>0 B
fonte