No contexto do Machine Learning , vi o termo Ground Truth usado muito. Pesquisei bastante e encontrei a seguinte definição na Wikipedia :
No aprendizado de máquina, o termo "verdade fundamental" refere-se à precisão da classificação do conjunto de treinamento para técnicas de aprendizado supervisionado. Isso é usado em modelos estatísticos para provar ou refutar hipóteses de pesquisa. O termo "truthing em terra" refere-se ao processo de coleta dos dados objetivos (prováveis) adequados para este teste. Compare com o padrão ouro.
A filtragem bayesiana de spam é um exemplo comum de aprendizado supervisionado. Nesse sistema, o algoritmo é ensinado manualmente as diferenças entre spam e não spam. Isso depende da verdade básica das mensagens usadas para treinar o algoritmo - imprecisões na verdade básica se correlacionam com imprecisões nos veredictos de spam / não spam resultantes.
O ponto é que eu realmente não consigo entender o que isso significa. Esse rótulo é usado para cada objeto de dados ou a função de destino que fornece um rótulo para cada objeto de dados ou talvez algo mais?
fonte
Verdade básica: essa é a realidade que você deseja que seu modelo preveja.
Pode haver algum ruído, mas você deseja que seu modelo aprenda o padrão subjacente nos dados que estão causando essa verdade básica. Praticamente, seu modelo nunca será capaz de prever a verdade do solo, pois a verdade do solo também terá algum ruído e nenhum modelo fornece cem por cento de precisão, mas você deseja que o seu modelo esteja o mais próximo possível.
fonte