As técnicas de regularização (devem?) Podem ser usadas em um modelo de efeitos aleatórios?

11

Por técnicas de regularização, estou me referindo a laço, regressão de crista, rede elástica e similares.

Considere um modelo preditivo de dados de assistência médica que contenha dados demográficos e de diagnóstico em que está sendo previsto o tempo de internação. Para alguns indivíduos, há várias observações de LOS (ou seja, mais de um episódio de PI) durante o período de linha de base que são correlacionadas.

Faz sentido construir, por exemplo, um modelo preditivo de rede elástica que contenha um termo de interceptação de efeito aleatório para cada indivíduo?

RobertF
fonte
Legendas para sua primeira linha: "Por técnicas de efeitos aleatórios (ou seja, suposições sobre como um parâmetro é distribuído aleatoriamente), estou me referindo a anteriores de Laplace e anteriores normais em parâmetros de regressão ... e similares" :-)
conjugateprior

Respostas:

7

Existem alguns trabalhos que tratam dessa questão. Eu procuraria em nenhuma ordem especial:

  1. Pen.LME: Howard D Bondell, Arun Krishna e Sujit K Ghosh. Seleção de variáveis ​​conjuntas para efeitos fixos e aleatórios em modelos lineares de efeitos mistos. Biometrics, 66 (4): 1069-1077, 2010.

  2. GLMMLASSO: Jurg Schelldorfer, Peter Buhlmann, Sara van de Geer. Estimativa para modelos de efeitos mistos lineares de alta dimensão usando a penalização L1. Scandinavian Journal of Statistics, 38 (2): 197-214, 2011.

que pode ser encontrado online.

Por acaso, estou terminando um trabalho sobre a aplicação de uma penalidade líquida elástica ao modelo misto (LMMEN) agora e planejo enviá-lo para revisão de periódico no próximo mês.

  1. LMMEN: Sidi, Ritov, Unger. Regularização e Classificação de Modelos Mistos Lineares através da Pena de Rede Elástica

Acima de tudo, se você estiver modelando dados que não são normais ou não têm um link de identidade, eu usaria o GLMMLASSO (mas cuidado, ele não pode lidar com muitos ERs). Caso contrário, o Pen.LME é bom, pois você não possui dados altamente correlacionados, seja nos efeitos fixos ou aleatórios. Neste último caso, você pode me enviar um e-mail e eu ficaria feliz em enviar um código / papel (eu o colocarei em operação no futuro próximo).

Carreguei hoje no CRAN - lmmen . Resolve o problema do modelo misto linear com uma penalidade do tipo rede elástica nos efeitos fixos e aleatórios simultaneamente.

Há também nas funções pacote cv para o lmmlasso e glmmLasso pacotes nele.

yonicd
fonte
1
Yonicd, a aplicação da rede elástica a modelos mistos lineares é exatamente o que estou procurando. Como estou trabalhando com dados genéticos correlacionados, a seleção agrupada de uma rede elástica seria muito útil. Tentei entrar em contato com você, mas não há outra maneira senão postar esta resposta, pois parece impossível enviar uma mensagem. De qualquer forma, estou ansioso para ler seu artigo e tentarei seu código assim que estiver disponível.
5

Sempre vi a regressão de cume como apenas modelos empíricos de efeitos aleatórios, não limitados a uma única variável categórica (e nenhuma matriz de correlação sofisticada). Você quase sempre pode obter as mesmas previsões através da validação cruzada de uma penalidade na cordilheira e do ajuste / estimativa de um efeito aleatório simples. No seu exemplo, você pode ser sofisticado e ter uma penalidade de crista separada nos recursos de demonstração / diag e outra nos indicadores do paciente (usando algo alinhado no fator de escala de penalidade glmnet). Como alternativa, você pode incluir um efeito aleatório sofisticado que tenha efeitos relacionados ao tempo por pessoa. Nenhuma dessas possibilidades está certa ou errada, é apenas útil.

Shea Parkes
fonte
2

Atualmente, estou pensando em uma pergunta semelhante. Acho que na aplicação, você pode fazê-lo se funcionar e acredita que é razoável usá-lo. Se é uma configuração usual em efeitos aleatórios (ou seja, você tem medidas repetidas para cada grupo), trata-se apenas da técnica de estimativa, que é menos controversa. Se você realmente não tem muitas medidas repetidas para a maioria dos grupos, ele pode estar na fronteira do modelo usual de efeitos aleatórios e você pode justificar cuidadosamente sua validade (do ponto de vista da metodologia), se você quiser propor isso como um general método.

ltx5151
fonte