Eu tenho um problema de classificação ( classe ), da ordem de 100 preditores de valor real, um dos quais parece ter muito mais poder explicativo do que qualquer outro. Eu gostaria de me aprofundar nos efeitos das outras variáveis. No entanto, as técnicas padrão de aprendizado de máquina (florestas aleatórias, SVMs etc.) parecem ter sido inundadas por um forte preditor e não me dão muita informação interessante sobre os outros.
Se esse fosse um problema de regressão, eu simplesmente regressaria contra o forte preditor e usaria os resíduos como entradas para outros algoritmos. Eu realmente não vejo como essa abordagem pode ser traduzida para um contexto de classificação.
Meu instinto é que esse problema deve ser razoavelmente comum: existe uma técnica padrão para lidar com ele?
fonte