Quando os modelos mistos de correlação zero são teoricamente sólidos?

25

A cotação em bloco abaixo, dos líderes no campo da modelagem de efeitos mistos, afirma que as mudanças de coordenadas nos modelos com correlação zero entre efeitos aleatórios (modelos 'ZCP') alteram as previsões do modelo. Mas, alguém pode elaborar ou justificar ainda mais suas reivindicações?

As declarações em questão são do artigo de Bates et al., 2015 lme4, Ajustando modelos de efeitos mistos lineares usando lme4 , página 7, segundo parágrafo ( link para download ).

Aqui está uma paráfrase do que eles escreveram:

Embora modelos de parâmetros de correlação zero sejam usados ​​para reduzir a complexidade de modelos de pistas aleatórias, eles têm uma desvantagem. Modelos nos quais declives e interceptações têm correlação diferente de zero são invariantes a mudanças aditivas de um preditor contínuo.

Essa invariância é interrompida quando a correlação é restrita a zero; qualquer mudança no preditor necessariamente levará a uma mudança na correlação estimada e na probabilidade e previsões do modelo. 1 Por exemplo, podemos eliminar a correlação em fm1 simplesmente deslocando Dias [o preditor que acompanha slope ] por uma quantidade igual à razão dos desvios padrão estimados entre sujeitos, multiplicados pela correlação estimada, ou seja , 2 ,

ρslope:intercept×σslopeσintercept

Idealmente, o uso de tais modelos deve ser restrito aos casos em que o preditor é medido em uma escala de razão (ou seja, o ponto zero na escala é significativo, não apenas um local definido por conveniência ou convenção).

Questões:

Numerados de acordo com os sobrescritos acima ...

  1. Eu posso ver que qualquer mudança no sistema de coordenadas pelo qual o preditor é medido levará a uma alteração na correlação estimada, levando a uma correlação diferente de zero. Isso apóia a afirmação de que os modelos de parâmetros de correlação zero não são invariantes em turnos nos sistemas de coordenadas preditivas e, portanto, que qualquer modelo com correlações de efeitos aleatórios diferentes de zero pode ser transformado em um modelo com correlações zero por uma mudança adequada nas coordenadas. Eu acho que ele também suporta o terceiro parágrafo da paráfrase acima: Os modelos ZCP (e modelos de interceptação zero - veja abaixo; mas por favor, verifique-me sobre isso ) são válidos apenas para modelos que utilizam certos sistemas de coordenadas especiais. Mas por que uma mudança de coordenada deve alterar as previsões para esses modelos?

    Por exemplo, uma mudança nas coordenadas também mudará o termo de interceptação de efeito fixo para médias de grupo (veja abaixo), mas apenas em uma quantidade apropriada à mudança na origem do sistema de coordenadas do preditor. Essa mudança não afeta as previsões do modelo, desde que o novo sistema de coordenadas seja usado para o preditor alterado.

    Para elaborar, se a inclinação de efeito fixo associada ao preditor alterado é positiva e a origem do sistema de coordenadas do preditor for alterada na direção negativa, a interceptação de efeito fixo diminuirá e qualquer interceptação aleatória de efeito associado também será alterada correspondentemente, refletindo a nova definição de 'origem' (e, portanto, interceptada) no sistema de coordenadas deslocadas. A propósito, acho que esse raciocínio também implica que um modelo de interceptação zero também não é invariável nessas mudanças.

  1. Acho que tenho uma maneira razoável de resolver isso, mas obtive uma resposta um pouco diferente de Bates et al. Estou errado em algum lugar?

    Abaixo está a minha resposta. A seguir, é apresentada a descrição de como cheguei ao meu resultado. Em resumo, acho que se eu mudar a origem negativamente por , para que no novo sistema de coordenadas o preditor assuma os valores , a correlação no novo sistema de coordenadas é zero se:δ > 0 x = x + δ ρ xδ>0x=x+δρ

    δ=ρslope:intercept×σinterceptσslope

    Isso difere do resultado de Bates et al .


Descrição do meu método (leitura opcional) : Digamos que temos a correlação de dois efeitos aleatórios, e ( para abreviar), ambos correspondentes ao mesmo fator de agrupamento com níveis (numerados por , variando de para ). Digamos também que o preditor contínuo com o qual a aleatória está emparelhada é chamado , definido de forma que o produto gere a contribuição condicional para o valor ajustado para o nívelinterceptar int k i 1 k declive x x x declive i y o b s i ρ x decliveslopeinterceptintki1kslopexx×slopeiy^obsido fator de agrupamento associado. Embora na realidade o algoritmo MLE determine o valor de para maximizar a probabilidade , eu esperaria que a expressão abaixo fosse uma maneira dimensionalmente correta de determinar os efeitos de uma tradução uniforme em , o multiplicador do efeito aleatório para .ρxslope

ρslope:int=Ei[(slopeislopei¯)(intiinti¯)]Ei[(slopeislopei¯)2]Ei[(intiinti¯)2]

Para chegar ao meu resultado, primeiro reescrevi o valor antigo da interceptação em termos de um novo valor para a interceptação, (aqui, , a' esquerda 'mudança de origem para o preditor ). Em seguida, substituí a expressão resultante no numerador da fórmula acima por , calculando o valor de que resultou em uma covariância zero no novo sistema de coordenadas. Observe que, conforme indicado na pergunta 1 acima, o termo de interceptação de efeito fixo também mudará de maneira análoga: . Aqui,δ > 0 x ρ δ β 0 = - δ × β x + β 0 β x x .int=δ×slope+intδ>0xρδβ0=δ×βx+β0βxé o preditor de efeito fixo associado ao preditor deslocado)x.

clarpaul
fonte
11
Algumas idéias aproximadas. muda se (1) a inclinação fixa mudar ou (2) as inclinações aleatórias mudarem. Para (1): a inclinação fixa pode ser vista como uma média ponderada das inclinações específicas do cluster, onde o peso depende em parte dos componentes de variação estimados. Omitir a covariância altera a var. estimativas, alterando os pesos, alterando a inclinação fixa. Para (2): as inclinações aleatórias são as inclinações específicas do cluster "encolhidas" em direção à inclinação fixa na proporção dos mesmos pesos. Omitir a covariância altera a var. estimativas, alterando o grau de contração, alterando as inclinações aleatórias. y^
Jake Westfall
Estou um pouco decepcionado por isso não ter recebido mais atenção, @clarpaul. Você pode simplesmente colocar sua própria resposta. Se ninguém mais responder, eu darei a recompensa a você.
gung - Restabelece Monica
Obrigado @gung, minha resposta estaria alinhada com minhas "Edições" acima. A recompensa seria legal, mas talvez eu não tenha tempo até que ela expire. Encorajo qualquer pessoa a pegar minhas "Edições" e transformá-las em uma resposta, se elas concordarem com o raciocínio básico e estiverem dispostas a dedicar algum tempo para aperfeiçoá-las um pouco.
clarpaul

Respostas:

4
  1. A resposta a essa pergunta acaba sendo bastante definitiva . Se alguém alterasse as coordenadas das variáveis ​​independentes de um modelo ZCP e permitisse que as correlações se desenvolvessem de maneira irrestrita , as previsões não mudariam, porque os modelos lineares de efeitos mistos com correlações irrestritas são invariantes à tradução (é possível mostrar isso com um pouco de matemática) . Mas, por definição , um modelo ZCP tem correlações restritas a . Nas coordenadas de deslocamento, não seria permitido desenvolver correlações conforme necessário em um modelo de LME irrestrito. Portanto, os modelos ZCP não são invariantes da tradução, e uma coordenada mudança seria0alterar previsões do modelo. E (se você espera que os modelos LME sejam invariantes à tradução para trocas de coordenadas sensíveis), apenas modelos nos quais essas trocas de coordenadas não fazem sentido são teoricamente sensatos como modelos ZCP (ou seja, os 'especiais' mencionados no terceiro parágrafo da paráfrase de Bates et al. acima). [Nota: Embelezarei esta resposta no futuro para incluir fórmulas derivadas para a correlação que se desenvolve ao mudar de coordenada um modelo inicialmente ZCP e para a prova de que modelos LME com correlações irrestritas são invariantes à tradução.]
  2. O resultado de Bates et al. É simplesmente um erro de digitação. A resposta deve ter as mesmas dimensões que o preditor, ( dias ), que é alterado. Como wlog, e podem ter dimensões de unidade, , que possui as dimensões (as mesmas dimensões da ), deve estar no denominador para que para ter as dimensões corretas.x σ i n t e r c e p t p σ s l o p e 1 / x s l o p e δδxσinterceptρσslope1/xslopeδ
clarpaul
fonte