Diário de bordo: abordagens de aprendizado de máquina

7

No passado, ao tentar diferentes algoritmos de aprendizado de máquina para resolver um problema, eu costumava escrever afogar o conjunto de abordagens em um notebook, mantendo detalhes como recursos, pré-processamento de recursos, normalização, algoritmos, parâmetros de algoritmos ... portanto, construindo um diário de bordo escrito à mão.

No entanto, atualmente, estou preocupado com o uso de uma ferramenta 'mais profissional', para que eu possa manter mais detalhes e até compartilhá-los com outros membros da equipe, que também podem marcar suas abordagens.

Seria uma ótima ferramenta automatizada e colaborativa que acompanhará o trabalho realizado, considerando detalhes como: recursos, algoritmos, parâmetro de algoritmos, pré-processo de dados, dados, métricas ... além de uma planilha colaborativa do Google Drive, por exemplo.

Como você está resolvendo isso? Como você está acompanhando o trabalho realizado? Qual é a sua ferramenta de diário de bordo ?

Muito obrigado antecipadamente.

Jorge
fonte

Respostas:

4

Como você está resolvendo isso? Como você está acompanhando o trabalho realizado? Qual é a sua ferramenta de diário de bordo?

Esta pode não ser a melhor abordagem. Mas é assim que minha equipe faz. Acreditamos que, para realizar um experimento completo de ciência de dados, a consciência adequada é muito importante. Portanto, usamos o Slack para o mesmo em nossas discussões e reuniões.

Além deles, temos arquivos Rmd (marcação R) para documentar o planejamento e as partes de análise.

Dawny33
fonte
11
Gosto da ideia de usar remarcações, no entanto, acho que não é a melhor abordagem / solução. É bom para começar. Também uso o Slack e recomendo-o para a coordenação de equipes e reuniões.
Jorge Jorge
@ Jorge Sim, concordo que não é a melhor abordagem :) No entanto, não encontrei uma boa alternativa que valha a pena gastar!
Dawny33
3

Verifique isso, parece exatamente o que você precisa http://www.openml.org

Diego
fonte
Este é um produto do Google? A interface do usuário parece muito com o google
Dawny33
11
Eu não sei. Não estou associado a esse site de forma alguma. Eles têm as informações de proprietários e proprietários listadas na primeira página.
Diego
2

Como você está resolvendo isso? Como você está acompanhando o trabalho realizado? Qual é a sua ferramenta de diário de bordo?

Para minha tese de bacharelado ( write-math.com ), escrevi meu próprio pequeno kit de ferramentas para passar por diferentes etapas de modelos / pré-processamento muito rapidamente. Cada experimento tinha um arquivo de configuração (consulte o repositório hwr-experimentações ). Por exemplo:

data-source: feature-files/baseline-3-points
training: '{{nntoolkit}} train --epochs 1000 --learning-rate 0.1 --momentum 0.1 --print-errors --hook=''!detl
    test {{testing}},err=testresult_%e.txt'' {{training}} {{validation}}
    {{testing}} < {{src_model}} > {{target_model}} 2>> {{target_model}}.log'
model:
    type: mlp
    topology: 24:500:369

O modelo treinado é armazenado; é muito rápido obter os resultados da avaliação (por exemplo, precisão, matriz de confusão).

Martin Thoma
fonte