Eu tenho 100 pacientes e cada paciente tem 10 medidas longitudinais de creatinina sérica. As taxas estimadas de filtração glomerular (TFGe) foram calculadas a partir de uma fórmula MDRD compreendendo sexo, idade e creatinina sérica. TFGe é a variável dependente e tempo é a variável independente em regressão linear para cada paciente.
- As regressões lineares violam a suposição dos "X independentes" e os modelos lineares mistos devem ser usados?
- As inclinações de TFGe (que são estimativas com incertezas em vez de números medidos) estimadas de cada paciente (em regressões lineares para cada paciente ou em efeitos aleatórios modelos mistos [como estimar inclinações para cada paciente em modelos mistos?]) Podem ser usadas como variáveis independentes ou dependentes em outros modelos de regressão?
Obrigado.
regression
mixed-model
repeated-measures
panel-data
Jinn-Yuh Guh
fonte
fonte
Respostas:
Na verdade, você está propondo usar a regressão linear como um procedimento matemático para condensar uma observação de 10 variáveis em uma única variável (a inclinação). Como tal, é apenas mais um exemplo de procedimentos semelhantes, como (digamos) usar uma média de medições repetidas como uma variável de regressão ou incluir pontuações dos componentes principais em uma regressão.
Seguem comentários específicos.
(1) A regressão linear não exige que os X's (variáveis independentes) sejam "independentes". De fato, na formulação padrão, o conceito de independência nem se aplica porque os X são valores fixos, não realizações de uma variável aleatória.
(2) Sim, você pode usar as inclinações como variáveis dependentes . Ajudaria a estabelecer que eles podem se comportar como a variável dependente na regressão linear. Para mínimos quadrados comuns, isso significa que
uma. As inclinações podem depender de alguns dos atributos do paciente.
b. A dependência é aproximadamente linear, pelo menos para o intervalo de atributos observados do paciente.
c. Qualquer variação entre uma inclinação observada e a inclinação hipotética pode ser considerada aleatória.
d. Essa variação aleatória é (i) independente de paciente para paciente e (ii) tem aproximadamente a mesma distribuição de paciente para paciente.
e Como antes, as variáveis independentes não são vistas como aleatórias, mas como fixas e medidas sem erros consideráveis.
Se todas essas condições se mantiverem aproximadamente, você deve estar bem. As violações de (d) ou (e) podem ser curadas usando generalizações de mínimos quadrados comuns.
(2 '). Como as inclinações exibem incerteza (medida na regressão usada para estimar as inclinações), elas podem não ser boas candidatas a variáveis independentes , a menos que você as esteja tratando aleatoriamente em um modelo misto ou usando um modelo de erros nas variáveis.
Você também pode lidar com essa situação por meio de um modelo hierárquico de Bayes .
fonte