Eu sou médico, por favor, seja gentil comigo e com meu entendimento básico de estatística.
Eu tenho um conjunto de dados composto por pacientes e suas visitas e identifiquei a presença de um tipo específico de toupeira na mão esquerda e / ou direita com valores {0,1} (0 = não presente e 1 = presente). O conjunto de dados fica assim:
** Eu o removi, pois as respostas são fornecidas; Posso enviá-lo mediante novo pedido
Portanto, isso significa que o paciente A1-001 teve 6 visitas sem presença de toupeira na mão direita durante todas as visitas e presente de toupeira na mão esquerda em todas as visitas, exceto a primeira.
Estou interessado em encontrar a probabilidade de uma mão desenvolver uma toupeira apenas entre os pacientes que desenvolveram uma toupeira em uma mão e encontrar a probabilidade de desenvolver uma toupeira na outra mão (dado que o paciente já tinha uma toupeira na outra mão) .
Além disso, quero saber qual é a probabilidade de desenvolver uma toupeira nas visitas entre os pacientes que desenvolveram uma toupeira em algum momento das duas mãos.
Você poderia me ajudar a modelar essas perguntas simples?
Respostas:
Pessoalmente, sinto que isso se presta bem a uma análise de sobrevivência.
Você tem pessoas sem toupeiras em uma determinada mão no início do período (sua população em risco); você pode selecioná-los e ter pontos no tempo para acompanhamento e se eles foram ou não censurados (desenvolveu uma toupeira). Isso representa um risco para qualquer coorte que você selecionou.
Você pode calcular uma taxa de risco (por exemplo, para desenvolver uma toupeira direita em pessoas com toupeiras esquerdas na linha de base, versus aquelas sem). Isso pode ser expresso em um gráfico Kaplan-Meier e virá com um intervalo de confiança.
fonte
Não há modelagem a ser feita aqui, todas as suas perguntas são simples probabilidades condicionais.
Tudo bem, como as pessoas não gostaram dessa resposta, você precisa esclarecer algumas coisas.
Você quer dizer por visita? Ou que nunca desenvolveram uma toupeira? Do seu exemplo:
Os pacientes 1 e 3 desenvolveram uma toupeira por um lado. O paciente 1 nunca desenvolveu uma toupeira, por outro lado, mas o paciente 3 o fez, portanto, você pode argumentar que a resposta para sua pergunta é 50%. Agora, você também pode argumentar que o paciente 1 fez 4 exames com 1 mole e não do outro e o paciente 3 teve 0 exames com 1 mole e não o outro, portanto a probabilidade pode ser de 1/5 = 20%. Depende de como você define sua pergunta.
fonte
Pessoalmente, acho que você pode começar estudando os modelos lineares generalizados de multicovariância : https://cran.r-project.org/web/packages/mcglm/index.html
https://cran.r-project.org/web/packages/mcglm/vignettes/GLMExamples.html
http://cursos.leg.ufpr.br/mcglm4aed/slides/2-mcglm.html#(1)
Esses modelos são apropriados para quando você tem mais de uma variável de resposta e não é gaussiana, e este é o seu caso, pois você tem duas variáveis binárias (toupeira ou não toupeira em cada mão). Além disso, o método permite lidar com dependências intraindividuais, fornecidas pela estrutura longitudinal. Aqui, longitudinal significa medidas repetidas para o mesmo indivíduo, ao longo do tempo.
Acho que os links acima ajudarão você a ter uma boa idéia sobre essas técnicas e também fornecem a implementação computacional em R.
fonte