Fiquei me perguntando se havia alguma técnica de aprendizado de máquina (não supervisionada) para modelar dados longitudinais? Eu sempre usei modelos de efeitos mistos (principalmente não lineares), mas queria saber se existem outras maneiras de fazer isso (usando o aprendizado de máquina).
Por aprendizado de máquina, quero dizer floresta aleatória, classificação / agrupamento, árvores de decisão e até aprendizado profundo, etc.
machine-learning
mixed-model
John_dydx
fonte
fonte
Respostas:
No caso em que há várias observações de um sujeito (por exemplo, várias visitas do mesmo paciente), o 'ID do paciente' é uma variável de 'agrupamento'. Cuidados devem ser tomados durante a avaliação do modelo, para que as visitas do mesmo paciente não apareçam nos dados de treinamento e teste, porque eles estão correlacionados e levarão à inflação da precisão do classificador .
A documentação do sklearn de validação cruzada possui iteradores de validação cruzada para dados agrupados. Consulte GroupKFold , LeaveOneGroupOut e LeavePGroupsOut .
Melhor ainda, tente redes neurais recorrentes ou modelos de Markov ocultos .
fonte
Você pode modelar sua longitudinal com métodos padrão de aprendizado de máquina, apenas adicionando recursos que representam a longitudinalidade, por exemplo, adicionando um recurso que representa o tempo. Ou um recurso que indica a associação a um grupo, pessoa etc. (no caso de dados do painel).
Se você é criativo com a criação / extração de recursos, pode modelar qualquer coisa com algoritmos ML.
fonte