Cálculo do tamanho da amostra para modelos mistos

23

Gostaria de saber se existem métodos para calcular o tamanho da amostra em modelos mistos? Estou usando lmerno R para ajustar os modelos (tenho inclinações e interceptações aleatórias).

Nikita Kuznetsov
fonte
3
A simulação é sempre uma opção - ou seja, simula dados sob uma hipótese alternativa específica e tamanho da amostra e adapta o modelo várias vezes para ver com que frequência você rejeita a hipótese nula de interesse. Da minha experiência, isso consome bastante tempo (computador), pois leva pelo menos alguns segundos para cada modelo se encaixar.
Macro

Respostas:

29

O longpowerpacote implementa os cálculos do tamanho da amostra em Liu e Liang (1997) e Diggle et al (2002). A documentação possui código de exemplo. Aqui está um, usando a lmmpower()função:

> require(longpower)
> require(lme4)
> fm1 <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy) 
> lmmpower(fm1, pct.change = 0.30, t = seq(0,9,1), power = 0.80)

     Power for longitudinal linear model with random slope (Edland, 2009) 

              n = 68.46972
          delta = 3.140186
         sig2.s = 35.07153
         sig2.e = 654.941
      sig.level = 0.05
              t = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
          power = 0.8
    alternative = two.sided
       delta.CI = 2.231288, 4.049084
           Days = 10.46729
        Days CI = 7.437625, 13.496947
           n.CI = 41.18089, 135.61202

Verifique também o liu.liang.linear.power()que " executa o cálculo do tamanho da amostra para um modelo misto linear"

Liu, G. e Liang, KY (1997). Cálculos de tamanho de amostra para estudos com observações correlacionadas. Biometrics, 53 (3), 937-47.

Diggle PJ, Heagerty PJ, Liang K, Zeger SL. Análise de dados longitudinais. Segunda edição. Oxford. Serires Ciência Estatística. 2002

Editar: Outra maneira é "corrigir" o efeito do agrupamento. Em um modelo linear comum, cada observação é independente, mas na presença de observações em cluster não são independentes, o que pode ser considerado como tendo menos observações independentes - o tamanho efetivo da amostra é menor. Essa perda de eficácia é conhecida como efeito de design :

DE=1+(m-1)ρ
onde é o tamanho médio do cluster e é o coeficiente de correlação intraclasse (coeficiente de partição de variação). Portanto, o tamanho da amostra obtido por meio de um cálculo que ignora o clustering é inflado pelo para obter um tamanho de amostra que permita o clustering.mρDE
Robert Long
fonte
3
Esse efeito de design é relevante apenas para as estatísticas lineares gerais (médias, totais). Para coeficientes de regressão, o DEFF é mais parecido com que é o ICC do regressor e é o ICC do termo de erro (erro composto = efeito aleatório do cluster + efeito específico da observação). Devido ao produto das correlações que tendem a ser pequenas, esse DEFF também é pequeno.
DEFF=1+(m-1)ρxρϵ,
ρxρϵ
StasK
Você pode me indicar uma citação para esta fórmula?
18607 Joshua Rosenberg
10

Para qualquer coisa além dos simples testes de 2 amostras, prefiro usar a simulação para estudos de tamanho ou potência da amostra. Com rotinas pré-empacotadas, às vezes você pode ver grandes diferenças entre os resultados dos programas com base nas suposições que eles estão fazendo (e talvez você não consiga descobrir quais são essas suposições, muito menos se forem razoáveis ​​para o seu estudo). Com a simulação, você controla todas as suposições.

Aqui está um link para um exemplo:
https://stat.ethz.ch/pipermail/r-sig-mixed-models/2009q1/001790.html

Greg Snow
fonte
Apenas imaginando, isso também funciona para os modelos GLMER?
precisa
1
@CarlosGlez, sim, isso funciona para qualquer modelo em que você possa simular dados e analisá-los. Eu fiz isso para os modelos GLMER.
Greg neve
Bem dito, e acrescentarei que, além de "controlar suposições", você também pode fazer perguntas "e se", quebrar essas suposições e determinar algum senso prático de robustez, por exemplo, se efeitos aleatórios não normais realmente arruinam a eficiência.
Adamo