Qual é a melhor maneira de categorizar as abordagens desenvolvidas para lidar com o problema de classe de desequilíbrio?
Este artigo os categoriza em:
- Pré-processamento: inclui métodos de superamostragem, subamostragem e híbrido,
- Aprendizagem sensível ao custo: inclui métodos diretos e meta-aprendizagem, que este último divide em limiar e amostragem,
- Técnicas de conjunto: inclui conjuntos sensíveis ao custo e pré-processamento de dados em conjunto com o aprendizado do conjunto.
A segunda classificação:
- Pré-processamento de dados: inclui alterações na distribuição e ponderação do espaço de dados. A aprendizagem em uma classe é considerada como mudança de distribuição.
- Métodos de aprendizagem para fins especiais
- Pós-processamento de previsão: inclui método de limite e pós-processamento sensível a custos
- Métodos híbridos:
O terceiro artigo :
- Métodos em nível de dados
- Métodos em nível de algoritmo
- Métodos híbridos
A última classificação também considera o ajuste do produto como uma abordagem independente.
Desde já, obrigado.
Respostas:
A maneira como vejo todas as três categorizações concorda em muitas coisas. Por exemplo, todos os três têm uma categoria para etapas de pré-processamento.
Eu tenderia a concordar principalmente com a terceira categorização como mais genérica e abrange mais coisas.
A única coisa que falta nos dois primeiros artigos são as etapas de pós-processamento, que para ser honesto, não são usadas na prática com a mesma frequência.
fonte