As inclinações nas regressões lineares podem ser usadas como variáveis ​​independentes ou dependentes em outros modelos de regressão?

8

Eu tenho 100 pacientes e cada paciente tem 10 medidas longitudinais de creatinina sérica. As taxas estimadas de filtração glomerular (TFGe) foram calculadas a partir de uma fórmula MDRD compreendendo sexo, idade e creatinina sérica. TFGe é a variável dependente e tempo é a variável independente em regressão linear para cada paciente.

  1. As regressões lineares violam a suposição dos "X independentes" e os modelos lineares mistos devem ser usados?
  2. As inclinações de TFGe (que são estimativas com incertezas em vez de números medidos) estimadas de cada paciente (em regressões lineares para cada paciente ou em efeitos aleatórios modelos mistos [como estimar inclinações para cada paciente em modelos mistos?]) Podem ser usadas como variáveis ​​independentes ou dependentes em outros modelos de regressão?

Obrigado.

Jinn-Yuh Guh
fonte
Se X's (variáveis ​​independentes) são variáveis ​​medidas, então é uma "variável aleatória" em vez de um "valor fixo". De acordo com a Wikipedia ( en.wikipedia.org/wiki/Random_variable ): "Em probabilidade e estatística, uma variável aleatória ou variável estocástica é, grosso modo, uma variável cujo valor resulta de uma medição em algum tipo de processo aleatório". Estou correcto?
Por favor, não use respostas para fazer perguntas. Você pode continuar essa conversa nos comentários. Outra opção é repassar isso como uma pergunta e criar um link aqui.
whuber

Respostas:

5

Na verdade, você está propondo usar a regressão linear como um procedimento matemático para condensar uma observação de 10 variáveis ​​em uma única variável (a inclinação). Como tal, é apenas mais um exemplo de procedimentos semelhantes, como (digamos) usar uma média de medições repetidas como uma variável de regressão ou incluir pontuações dos componentes principais em uma regressão.

Seguem comentários específicos.

(1) A regressão linear não exige que os X's (variáveis ​​independentes) sejam "independentes". De fato, na formulação padrão, o conceito de independência nem se aplica porque os X são valores fixos, não realizações de uma variável aleatória.

(2) Sim, você pode usar as inclinações como variáveis dependentes . Ajudaria a estabelecer que eles podem se comportar como a variável dependente na regressão linear. Para mínimos quadrados comuns, isso significa que

uma. As inclinações podem depender de alguns dos atributos do paciente.

b. A dependência é aproximadamente linear, pelo menos para o intervalo de atributos observados do paciente.

c. Qualquer variação entre uma inclinação observada e a inclinação hipotética pode ser considerada aleatória.

d. Essa variação aleatória é (i) independente de paciente para paciente e (ii) tem aproximadamente a mesma distribuição de paciente para paciente.

e Como antes, as variáveis ​​independentes não são vistas como aleatórias, mas como fixas e medidas sem erros consideráveis.

Se todas essas condições se mantiverem aproximadamente, você deve estar bem. As violações de (d) ou (e) podem ser curadas usando generalizações de mínimos quadrados comuns.

(2 '). Como as inclinações exibem incerteza (medida na regressão usada para estimar as inclinações), elas podem não ser boas candidatas a variáveis independentes , a menos que você as esteja tratando aleatoriamente em um modelo misto ou usando um modelo de erros nas variáveis.

Você também pode lidar com essa situação por meio de um modelo hierárquico de Bayes .

whuber
fonte
Sinto muito pelo nome impróprio de "X independentes". O que eu quis dizer foi "Ys independentes dependentes de Xs". Ou seja, os resíduos devem ser independentes. Esta suposição é violada em observações longitudinais. Referência: modelagem de dados longitudinais, II: modelos e extensões de regressão padrão. Métodos Mol Biol. 2009; 473: 61-94.
Jinn-Yuh Guh
Você pode descobrir mais sobre as 'generalizações dos mínimos quadrados' mencionadas acima em Lewis e Linzer 2005
conjugateprior