Eu me deparei com um boato de que algum estudo mostrou que o desempenho de modelos preditivos depende mais da experiência do analista de dados com o método escolhido do que da escolha do método.
Em outras palavras, a alegação é que é mais importante que o analista de dados esteja familiarizado com o método escolhido do que quão "apropriado" o método pareceria para o problema de um ponto de vista mais teórico.
Isso foi mencionado no contexto da quimiometria, que envolve tipicamente problemas de muitas variáveis (100s - 1000s), colinearidade múltipla e, é claro, poucas amostras. A previsão pode ter sido classificação ou regressão.
Minha experiência pessoal sugere que isso é plausível , mas um estudo foi mencionado (perguntei à pessoa que mencionou isso por e-mail após uma pesquisa rápida, mas sem êxito, mas nunca recebeu resposta). No entanto, também com uma pesquisa mais elaborada, não consegui rastrear nenhum artigo.
Alguém está ciente dessas descobertas? Se não, o que a experiência pessoal dos Caras Grandes aqui diz?
fonte
Respostas:
Na verdade, ouvi rumores de que máquinas decentes de aprendizado geralmente são melhores que especialistas, porque a tendência humana é minimizar a variação às custas do viés (excessivamente suave), levando a um desempenho preditivo ruim em novos conjuntos de dados. A máquina é calibrada para minimizar o MSE e, portanto, tende a se sair melhor em termos de previsão em um novo conjunto de dados .
fonte