Ao estudar os métodos de mineração de dados, entendi que existem duas categorias principais:
Métodos preditivos:
- Classificação
- Regressão
Métodos descritivos:
- Agrupamento
- Regras de associação
Como desejo prever a disponibilidade (saída) do usuário com base no local, atividade, nível da bateria (entrada para o modelo de treinamento), acho óbvio que eu escolheria "Métodos preditivos", mas agora não consigo escolher entre classificação e regressão. Pelo que entendi até agora, a classificação pode resolver meu problema, porque a saída está "disponível" ou "não disponível".
A classificação pode me fornecer a probabilidade (ou probabilidade) de o usuário estar disponível ou não?
Como na saída, não seria apenas 0 (não disponível) ou 1 (disponível), mas será algo como:
- disponível
- não disponível
Esse problema também pode ser resolvido usando regressão?
Você pode usar a classificação ingênua de bayes e calcular probabilidades posteriores usando crenças anteriores ou a regressão logística pode ser usada com a função sigmóide.
fonte