Prever a duração da tarefa

Estou tentando criar um modelo de regressão que prevê a duração de uma tarefa. Os dados de treinamento que possuo consistem em aproximadamente 40 mil tarefas concluídas com estas variáveis: Quem executou a tarefa (~ 250 pessoas diferentes) Em que parte (subprojeto) do projeto a tarefa foi...