Estou recebendo o erro "Novos níveis de fatores não presentes nos dados de treinamento". Mas verifiquei os nlevels e a classe de todas as colunas em desenvolvimento, bem como os dados de teste, e eles são os mesmos. Alguma explicação plausível?
7
Respostas:
A RF lida com fatores codificando-os de uma só vez. Ele cria uma nova coluna fictícia para cada nível da variável fator. Quando há níveis de fator novos ou diferentes em um quadro de dados de pontuação, coisas ruins acontecem.
Se o trem e o teste existiram juntos na mesma estrutura de dados no ponto em que o fator foi definido, não há problema. Quando o teste tem seu fator definido separadamente, você recebe problemas.
Você pode solucionar esse problema informando seus fatores de pontuação para corresponder aos dados de treinamento.
fonte