Em um estudo longitudinal, os resultados de unidades são medidos repetidamente nos pontos de tempo com um total de ocasiões de medição fixas (fixo = medições nas unidades são feitas ao mesmo tempo). i t m
As unidades são atribuídas aleatoriamente a um tratamento, , ou a um grupo controle, . Quero estimar e testar o efeito médio do tratamento, ou seja, onde as expectativas são tomadas ao longo do tempo e dos indivíduos. Considero usar um modelo multinível de ocasião fixa (efeitos mistos) para este propósito:G = 0 A T E = E ( Y | G = 1 ) - E ( Y | G = 0 ) ,
com o intercepto, o , um intercepto aleatório entre unidades e o residual.β A T E u e
Agora estou considerando um modelo alternativo
que contém os efeitos fixos para cada ocasião onde manequim se e outro. Além disso, este modelo contém uma interação entre tratamento e tempo com parâmetros . Portanto, este modelo leva em consideração que o efeito de pode diferir ao longo do tempo. Isso é informativo por si só, mas acredito que também deve aumentar a precisão da estimativa dos parâmetros, porque a heterogeneidade em é levada em consideração. t d t = 1 j = t 0 γ G Y
No entanto, neste modelo, o coeficiente não parece mais igual ao . Em vez disso, representa o ATE na primeira ocasião ( ). Portanto, a estimativa de pode ser mais eficiente que mas não representa mais o . UmtEt=1 ~ β βATE
Minhas perguntas são :
- Qual é a melhor maneira de estimar o efeito do tratamento neste projeto de estudo longitudinal?
- Preciso usar o modelo 1 ou existe uma maneira de usar (talvez mais eficiente) o modelo 2?
- Existe uma maneira de ter a interpretação do e o desvio específico da ocasião (por exemplo, usando a codificação de efeitos)? ATEγ
Respostas:
Respondendo à sua pergunta "Gostaria de saber como tirar o ATE do modelo 2" nos comentários:
Primeiro, no seu modelo 2, nem todos são identificáveis, o que leva ao problema de deficiência de classificação na matriz de design. É necessário diminuir um nível, por exemplo, assumindo para . Ou seja, usando a codificação de contraste e assumindo que o efeito do tratamento no período 1 é 0. Em R, ele codificará o termo de interação com efeito de tratamento no período 1 como o nível de referência, e é também por isso que tem a interpretação do efeito do tratamento no período 1. No SAS, ele codifica o efeito do tratamento no período como o nível de referência, então tem a interpretação do efeito do tratamento no períodoγ j = 0 j = 1 ˜ β m ˜ β mγj γj=0 j=1 β~ m β~ m , não período 1 mais.
Supondo que o contraste seja criado da maneira R, os coeficientes estimados para cada termo de interação (ainda o por , embora não seja exatamente o que você definiu em seu modelo) tenham a interpretação da diferença do efeito do tratamento entre o período de tempo e período 1. Indique ATE em cada período , então para . Portanto, um estimador para é . (ignorando a diferença de notação entre o parâmetro verdadeiro e o próprio estimador, porque a preguiça)γj j ATEj γj=ATEj−ATE1 j=2,…,m ATEj β~+γj ATE=β=1m∑mj=1ATEj=β~+(β~+γ2)+⋯+(β~+γm)m=β~+1m(γ2+⋯+γm) .
Fiz uma simulação simples em R para verificar isso:
E os resultados confirmam isso:
Não sei como alterar diretamente a codificação de contraste no modelo 2 acima, para ilustrar como é possível usar diretamente uma função linear dos termos de interação, bem como obter o erro padrão, usei o pacote multcomp:
E aqui está a saída:
Penso que o erro padrão é obtido por com sendo a forma de combinação linear acima e a matriz estimada de variância-covariância dos coeficientes do modelo 3. WVwV^wT−−−−−√ w V
Codificação de desvio
Outra maneira de fazer com que tenha a interpretação direta de é usar a codificação de desvio , para que as covariáveis posteriores representem a comparação : ATEATEj-ATEβ~ ATE ATEj−ATE
Resultado:
fonte
beta_t
Para a primeira pergunta, meu entendimento é que maneiras "sofisticadas" são necessárias apenas quando não é imediatamente óbvio que o tratamento é independente de possíveis resultados. Nesses casos, você precisa argumentar que algum aspecto dos dados permite uma aproximação da atribuição aleatória ao tratamento, o que nos leva a variáveis instrumentais, descontinuidade da regressão e assim por diante.
No seu caso, as unidades são aleatoriamente designadas para o tratamento, portanto, parece crível que o tratamento seja independente dos possíveis resultados. Então, podemos simplificar as coisas: estimar o modelo 1 com mínimos quadrados comuns e você tem uma estimativa consistente do ATE. Como as unidades são aleatoriamente designadas para o tratamento, este é um dos poucos casos em que uma hipótese de efeitos aleatórios é crível.
fonte