Por técnicas de regularização, estou me referindo a laço, regressão de crista, rede elástica e similares.
Considere um modelo preditivo de dados de assistência médica que contenha dados demográficos e de diagnóstico em que está sendo previsto o tempo de internação. Para alguns indivíduos, há várias observações de LOS (ou seja, mais de um episódio de PI) durante o período de linha de base que são correlacionadas.
Faz sentido construir, por exemplo, um modelo preditivo de rede elástica que contenha um termo de interceptação de efeito aleatório para cada indivíduo?
Respostas:
Existem alguns trabalhos que tratam dessa questão. Eu procuraria em nenhuma ordem especial:
Pen.LME: Howard D Bondell, Arun Krishna e Sujit K Ghosh. Seleção de variáveis conjuntas para efeitos fixos e aleatórios em modelos lineares de efeitos mistos. Biometrics, 66 (4): 1069-1077, 2010.
GLMMLASSO: Jurg Schelldorfer, Peter Buhlmann, Sara van de Geer. Estimativa para modelos de efeitos mistos lineares de alta dimensão usando a penalização L1. Scandinavian Journal of Statistics, 38 (2): 197-214, 2011.
que pode ser encontrado online.
Por acaso, estou terminando um trabalho sobre a aplicação de uma penalidade líquida elástica ao modelo misto (LMMEN) agora e planejo enviá-lo para revisão de periódico no próximo mês.
Acima de tudo, se você estiver modelando dados que não são normais ou não têm um link de identidade, eu usaria o GLMMLASSO (mas cuidado, ele não pode lidar com muitos ERs). Caso contrário, o Pen.LME é bom, pois você não possui dados altamente correlacionados, seja nos efeitos fixos ou aleatórios. Neste último caso, você pode me enviar um e-mail e eu ficaria feliz em enviar um código / papel (eu o colocarei em operação no futuro próximo).
Carreguei hoje no CRAN - lmmen . Resolve o problema do modelo misto linear com uma penalidade do tipo rede elástica nos efeitos fixos e aleatórios simultaneamente.
Há também nas funções pacote cv para o lmmlasso e glmmLasso pacotes nele.
fonte
Sempre vi a regressão de cume como apenas modelos empíricos de efeitos aleatórios, não limitados a uma única variável categórica (e nenhuma matriz de correlação sofisticada). Você quase sempre pode obter as mesmas previsões através da validação cruzada de uma penalidade na cordilheira e do ajuste / estimativa de um efeito aleatório simples. No seu exemplo, você pode ser sofisticado e ter uma penalidade de crista separada nos recursos de demonstração / diag e outra nos indicadores do paciente (usando algo alinhado no fator de escala de penalidade
glmnet
). Como alternativa, você pode incluir um efeito aleatório sofisticado que tenha efeitos relacionados ao tempo por pessoa. Nenhuma dessas possibilidades está certa ou errada, é apenas útil.fonte
Atualmente, estou pensando em uma pergunta semelhante. Acho que na aplicação, você pode fazê-lo se funcionar e acredita que é razoável usá-lo. Se é uma configuração usual em efeitos aleatórios (ou seja, você tem medidas repetidas para cada grupo), trata-se apenas da técnica de estimativa, que é menos controversa. Se você realmente não tem muitas medidas repetidas para a maioria dos grupos, ele pode estar na fronteira do modelo usual de efeitos aleatórios e você pode justificar cuidadosamente sua validade (do ponto de vista da metodologia), se você quiser propor isso como um general método.
fonte