Medindo alguns dos pacientes mais de uma vez

10

Estou conduzindo um estudo clínico em que determino uma medida antropométrica dos pacientes. Eu sei como lidar com a situação em que tenho uma medida por paciente: faço um modelo, onde tenho uma amostra aleatória de alguma densidade , e faço as coisas habituais: escreva a probabilidade de a amostra, estimar parâmetros, determinar conjuntos de confiança e testar hipóteses, ou mesmo fazer algumas análises bayesianas se o chefe não estiver assistindo. ;-)X1,,Xnfθ

Meu problema é que, para alguns pacientes, temos mais de uma medida, porque acreditamos que é uma boa idéia ter mais de um pesquisador manipulando o dispositivo de medição, quando isso for possível (algumas vezes, temos apenas um pesquisador trabalhando na clínica ) Portanto, para alguns pacientes, temos uma medida feita por um pesquisador, para outras unidades amostrais, temos duas medidas feitas por dois pesquisadores diferentes, e assim por diante. A medida em questão é a espessura de uma dobra específica da pele.

Minha pergunta: que tipo de modelo estatístico é adequado para o meu problema?

Wronski
fonte
4
A menos que as perguntas de interesse estejam relacionadas a pesquisadores específicos e você tenha informações para saber quem fez quais medidas, você pode estar olhando para modelos mistos, com um efeito aleatório de 'pesquisador' (o que pode explicar coisas como um pesquisador que tem pouco, mas vieses consistentes, por exemplo).
Glen_b -Reinstate Monica
11
Você tem as informações de qual pesquisador fez qual medida? Você acha que algumas pesquisas cometem erros sistemáticos? Ou que alguns pesquisadores medem com mais precisão do que outros?
user31264
11
Na prática, você realmente encontra grandes diferenças entre os pesquisadores que medem o mesmo paciente aproximadamente ao mesmo tempo?
EdM
Assim como @Glen_b, acho que você deveria olhar para modelos de efeitos mistos, talvez isso possa ser um começo: stats.stackexchange.com/questions/166434/…

Respostas:

1

Veja o artigo de Brennan (1992) sobre a Generalizability Theory ou seu livro, também intitulado "Generalizability Theory" (2010, Springer). Brennan escreve sobre GT usando ANOVA, mas modelos mistos poderiam ser usados ​​da mesma maneira - e muitos os considerariam um método mais recente.

Você poderia pensar em um modelo misto para dados classificados cruzados (por exemplo , Raudenbush, 1993 ). Digamos que você tenha pacientes medidas por pesquisadores, e sua medição é denotado como para e . Nesse caso, a medição tem efeitos de pacientes e pesquisadores, com pacientes "aninhados" em pesquisadores (várias medidas para um único paciente) e pesquisadores "aninhados" em pacientes (várias medidas para cada paciente), portantoNRXiji=1,...,Nj=1,...,R

Xij=β0+bi+bj+εij

onde é uma interceptação fixa (se os dados não estiverem centralizados), é efeito aleatório do paciente (interceptação aleatória) e é um efeito aleatório do pesquisador, enquanto é um termo de erro. No lme4 isso seriaβ0bibjεij

x ~ (1|patient) + (1|researcher)

você pode estender essa abordagem para usar como uma variável independente ou definir um modelo bayesiano hierárquico em que inclua as duas fontes de variabilidade.X

Tim
fonte
0

Vou dar uma olhada nisso, mesmo que eu possa fornecer apenas um modelo matemático, já que sou um pouco nerd de matemática, mas não um estatístico.

Os Kalman Filters podem lidar com a estimativa de estado com várias entradas e informações ausentes.

Se eu tivesse que mostrar isso aos engenheiros, eles exigiriam que eu fizesse plotagens de medidas de variabilidade entre técnicos de medição para mostrar que não há variabilidade de operador para operador. Eles tratariam duas medidas como emparelhadas. O pessoal das estatísticas é bom nisso. Se a variabilidade entre operadores fosse insignificante, eu poderia formular meus dados com cada um como uma única linha.

  • [... medição_1 ... resultado]
  • [... medição_2 ... resultado]

se apenas um técnico fizesse a medição, haveria apenas uma linha de dados

caso contrário, eu gostaria de ter uma indicação do operador dentro dos dados

  • [... medição do nome do operador ... resultado]

Se você pode caracterizar a diferença que cada operador possui na mesma medida, é possível contabilizá-la em seu modelo. Se você não fornecer um indicador de operador, quando é uma fonte significativa de variabilidade ... isso pode ser um problema.

O modelo de dados informa o modelo matemático. Acho que os GLM tiveram bons resultados nessas áreas. http://www.uta.edu/faculty/sawasthi/Statistics/stglm.html

EngrStudent
fonte
0

Também estou abordando essa questão de um campo diferente. Independentemente disso, parece-me que o objetivo de várias pessoas usarem o dispositivo de medição é poder explicar o erro de medição? Se estou certo quanto ao que você está tentando fazer, parece um caso de modelagem de equações estruturais (SEM), o que permitiria executar seu modelo sem erros de medição. O SEM pode ser responsável por dados ausentes, se você usar técnicas de estimativa de FIML, terá que fazer as suposições usuais sobre os dados ausentes (ou seja, pelo menos faltando aleatoriamente). Os modelos SEM foram cada vez mais usados ​​nas configurações de RCT, portanto, não acho que seria incomum usar essa técnica. A pergunta que eu teria é: você tem informações suficientes para criar um modelo SEM adequadamente identificável?

bfoste01
fonte