Usando o ML para auxiliar a rotulagem humana no conjunto de dados com classes altamente desequilibradas

Existem problemas científicos com o uso do ML para ajudar na anotação humana? Eu tenho um conjunto de dados sem rótulo de 3 classes em que apenas 1 em 500 elementos pertencem às 2 classes de interesse. Os rótulos não são trivialmente discerníveis para todos os elementos dos dados não rotulados,...