Alguém já usou (e gostou) de bons pacotes de "mineração de sequência frequente" no Python que não sejam o FPM no MLLib? Estou à procura de um pacote estável, de preferência mantido por pessoas. Obrigado!
python
sequential-pattern-mining
Edamame
fonte
fonte
Estou mantendo ativamente uma implementação eficiente do PrefixSpan e do BIDE no Python 3, suportando a mineração de padrões seqüenciais freqüentes e top-k (fechados).
https://github.com/chuanconggao/PrefixSpan-py
fonte
Eu usei a função fpgrowth do fim no passado e funcionou bem. No entanto, é meio difícil instalar em máquinas Windows. Parece ser um site acadêmico, então não tenho certeza se eles estão fazendo muitas atualizações no código ao longo do tempo ...
fonte
Você já pensou em escrever sozinho? Porque provavelmente não há uma biblioteca mantida atualizada no momento.
Verifique isso, é o básico - os padrões PrefixSpan e Closed / Maximal não são tão difíceis de implementar:
http://sequenceanalysis.github.io/
fonte
O SPMF parece uma biblioteca útil para mineração de padrões: http://www.philippe-fournier-viger.com/spmf/
fonte