Como introduzir suavemente epidemiologistas / colegas de saúde pública na modelagem preditiva avançada?

8

Vindo de um background em ciências sociais e epidemiologia, meus colegas de trabalho foram treinados em regressão de mínimos quadrados, regressão logística e análise de sobrevivência. Eles gostam de ver intervalos de confiança de 95% e valores de p com os coeficientes de parâmetro e desconfiam das ferramentas preditivas mais atuais, como redes neurais, CART, empacotamento e reforço, além de técnicas de regressão penalizadas.

RobertF
fonte
4
Meu curso de curta duração é destinado a esse público, entre outros. Informações, incluindo folhetos, estão no site da versão semestral do curso: biostat.mc.vanderbilt.edu/CourseBios330 . Uma das muitas coisas que abordo é por que não é razoável os coeficientes de regressão logística anti-log para obter índices de chances; isso ocorre no contexto de permitir que os efeitos sejam não-lineares e obtenha, por exemplo, razões de chances no intervalo interquartil.
Frank Harrell
2
Gosto dos dois livros seguintes: Uma Introdução à Aprendizagem Estatística: com Aplicações em R (James, Witten, Hastie e Tibshirani). Os elementos do aprendizado estatístico: mineração de dados, inferência e previsão (Hastie, Tibshirani, Friedman). Também acho que os epidemiologistas preferem modelos de regressão paramétricos (os modelos do tipo GLM mencionados) para estimativa e inferência em comparação com os modelos modernos de regressão semi / não paramétrica. Suponho que grande parte do trabalho deles se concentre na descoberta / explicação de fatores de risco / proteção, em vez de gerar ajustes de regressão flexíveis (para previsão)?
Chris
2
@RobertF: Isso é verdade para a maioria das profissões (inércia?). No entanto, os epidemiologistas geralmente se interessam por modelos explicativos e nem sempre é totalmente claro como abordagens preditivas mais inovadoras, como a penalização, devem ser utilizadas quando, por exemplo, se deseja avaliar a interação confusa em uma exposição de interesse. Curso de Frank Harrell, livro e seu departamento. O site contém muito material útil que também pode ser aplicado em epidemiologia.
Thomas Speidel
1
@RobertF: Isso é algo que eu tenho dificuldade em entender. Se estamos propositadamente enviesando as estimativas dos efeitos para reduzir o sobreajuste, como podemos tratá-los como se não fossem enviesados ​​quando queremos interpretá-los?
Thomas Speidel
1
@ Chris Uma das ferramentas de análise de sobrevivência mais comuns utilizadas pelos epidemiologistas é o modelo semi-paramétrico.
Fomite

Respostas:

6

Eu vou pesar como um epidemiologista.

Percebo a inércia à medida que pesquisadores e profissionais da área da saúde passam para a gerência intermediária e mais além e ficam fora de contato com os novos desenvolvimentos nas estatísticas.

Primeiro, eu aconselho fortemente que você não assuma que isso é simplesmente inércia, seja na forma da disciplina que não deseja adotar novas técnicas, seja nos colegas de trabalho que estão perdendo contato com os novos desenvolvimentos estatísticos. Você pode ir a conferências de epidemiologia acadêmica em que um trabalho novo e muito metodologicamente sofisticado está sendo realizado, e ainda não necessariamente encontra muita coisa na modelagem preditiva.

A dica está no nome. Modelagem preditiva .

A epidemiologia, como um campo, não está particularmente interessada em previsão por si mesma. Em vez disso, seu foco está no desenvolvimento de explicações etiológicas para os padrões de doenças observados em uma população. Os dois são relacionados, mas distintos, e isso geralmente leva a uma desconfiança filosófica das técnicas mais modernas de classificação e previsão que tentam puramente maximizar o impacto preditivo de um modelo. No extremo disso, estão as pessoas que pensam que a seleção de variáveis ​​deve ser realizada principalmente com o uso de algo como um gráfico acíclico direcionado, que pode ser considerado o oposto de onde a modelagem preditiva está indo.

Isso resulta em não fazer parte de seus antecedentes, não ser algo que eles encontram muito na literatura e ser perfeitamente franco, uma alta probabilidade de que sua exposição a isso tenha sido feita por pessoas que realmente não entendem os problemas que estão tentando resolver.

Este, nos comentários, é um exemplo perfeito:

Isso impressiona algumas pessoas - o fato de introduzirmos intencionalmente um viés na regressão penalizada para melhorar a precisão preditiva

Quase todos os epidemiologistas que conheço, se você os escolher, escolheriam uma redução no viés em relação a um aumento na precisão.

Isso não quer dizer que nunca seja mencionado. Há momentos em que modelos preditivos são usados ​​- geralmente em casos clínicos em que a previsão do resultado desse paciente em particular é de interesse considerável, ou detecção de surtos, em que essas técnicas são úteis porque não sabemos o que está por vir e não podemos tornar etiológicos. argumentos. Ou quando a previsão realmente é o objetivo - por exemplo, em muitos modelos de estimativa de exposição. Eles são apenas um pouco de nicho no campo.

Fomite
fonte
Peço desculpas se isso é um pouco ofensivo, não pretendo que seja. Quanto do treinamento de um epidemiologista é em estatística e / ou matemática? Puramente por minha própria experiência, os epidemiologistas que conheci (e conheci um número considerável) estão mal equipados estatisticamente para usar e interpretar os modelos que eles mostraram. Muitos deles têm ignorado conceitos básicos, como correções de testes múltiplos e outras questões práticas. Eu queria saber se você poderia comentar sobre isso. Eu simplesmente conheci epidemiologistas ruins ou é um fenômeno amplo da disciplina? Mais uma vez, espero que não era
Chris C
1
@ChristC Parte do problema é, em comparação com o "estatístico", o epidemiologista é um campo muito amplo. Há muitas pessoas que podem se dar bem com tabelas 2x2 e matemática não menos complexas que a divisão longa, porque para a maioria dos problemas de saúde pública local, isso é suficiente. 1 / n
Fomite
1
Há também algumas peculiaridades do campo (Charlie Poole, da UNC, argumenta: várias correções de comparação são um conceito defeituoso em Epidemiologia) e falta de educação porque a maioria dos epi são usuários de modelos e, para ser franco, os programas estatísticos geralmente são totalmente desinteressado em ensiná-los. 2 / n
Fomite
1
No outro extremo do espectro, você tem alguns metodologistas muito sofisticados trabalhando em problemas com foco epi - inferência causal, modelos de sistemas, riscos concorrentes, etc., que são extremamente conhecedores. Tudo só depende muito do tipo de trabalho que fazem, seus antecedentes, etc. n / n
fomite
1
@ChrisC Um exemplo particularmente ilustrativo que acabei de lembrar. Na mesma conferência, na mesma sessão , eu estava apresentando uma nova abordagem (embora um pouco derivativa) para modelar a sazonalidade usando modelos de regressão com funções harmônicas. A conversa antes da minha? Gráfico de setores. Ambos com muita credibilidade poderiam ser chamados de "Epidemiologia".
Fomite