Por que o uso pouco frequente de técnicas de aprendizado de máquina na biomedicina translacional?

8

Isso segue uma pergunta anterior. aqui :

Modelo de rede neural para prever o resultado do tratamento

e pode ser considerado para se referir a um aspecto diferente desta pergunta:

Aplicação de técnicas de aprendizado de máquina em estudos clínicos de pequenas amostras

Obrigado a Zach, que sugeriu a publicação.

Coloquei algumas leituras bastante sérias agora no CART, randomForest, Redes Neurais e aprendizado de máquina em geral, aprendi sobre os pacotes WEKA e R, vi e segui as palestras de engenharia de Stanford http://www.ml-class.org/ curso / aula / índice, Eu tenho 3 capítulos em Hastie. Dado o tipo de dados que vemos regularmente em pesquisas clinicamente orientadas - cargas de parâmetros clínicos + cargas de parâmetros bioquímicos + dados de testes de caneta e papel +/- dados de neuroimagem com números pequenos, sinto que estou perdendo alguma coisa. Não estou lendo regularmente sobre técnicas de ML aplicadas na literatura de pesquisa. Minha pergunta é: acabei de me apegar a algo que é duvidoso e, portanto, considerado com suspeita justificada pesquisando clínicos e bioestatísticos que estão bem cientes disso, ou essas técnicas são genuinamente ignoradas ou temidas fora da "análise de negócios"? O que mantém o "nicho"?

Rosser
fonte
Acho que o problema aqui está mais relacionado ao que você lê do que qualquer outra coisa. O aprendizado de máquina é bastante aplicado na medicina translacional moderna, desde que os modelos de caixa preta sejam aceitáveis ​​para a tarefa.
Marc Claesen

Respostas:

8

As técnicas de aprendizado de máquina geralmente carecem de interpretabilidade. Além disso, eles tendem a ser bastante grosseiros do ponto de vista estatístico - por exemplo, redes neurais não fazem suposições sobre os dados de entrada. Tenho a sensação de que muitas pessoas (especialmente se elas têm um forte histórico estatístico) as desprezam.

bayerj
fonte
Sim, acho que entendi. No entanto, do meu ponto de vista, os métodos estatísticos não são puros nem sujos, apenas a aplicação da lógica aos dados. Se você quer uma pílula para curar alguma coisa, precisa entender as inter-relações e levá-la ao laboratório de biologia molecular. No entanto, se você deseja apenas fazer uma previsão usando métodos de caixa preta (NN / RF) ou de decisão (CART), qual é o problema? Você pode até ter uma ideia. É mais profundo que esnobismo?
Rosser
Embora a interpretabilidade seja certamente agradável, não tenho certeza se consultaria um médico que sabe o que está fazendo e tem uma taxa de sucesso de 60% em comparação com um médico que não tem idéia, mas tem uma taxa de sucesso de 100%;)
blubb
1
Você pode estar interessado na 'Modelagem Estatística - As duas culturas' de Leo Breiman, onde isso é abordado em profundidade ( recognition.su/wiki/images/8/85/Breiman01stat-ml.pdf ) Além disso, há razões para essa abordagem - - se você quer que os humanos interpretem as coisas, por exemplo.
bayerj
@blubb Gostaria de consultar um médico que não tem idéia, mas 100% de sucesso com um intervalo de confiança [98.100] :) #
Simone
4

O histórico de aprendizado de máquina em biomedicina não tem sido muito bom. Os primeiros sucessos no aprendizado de máquina tiveram alto sinal: áreas de reconhecimento de padrões de taxa de ruído, como reconhecimento visual de padrões. A proporção S: N é muito menor em biologia e ciências sociais. O aprendizado de máquina se encaixa efetivamente em muitas interações entre preditores e, para isso, é necessário ter um tamanho de amostra enorme ou uma proporção S: N muito alta. Veja A medicina é hipnotizada pelo aprendizado de máquina? . Além disso, muitos profissionais de aprendizado de máquina entenderam mal as tarefas de previsão como tarefas de classificação. Veja aqui para mais.

Frank Harrell
fonte