Uma análise interina é uma análise dos dados em um ou mais momentos antes do fechamento oficial do estudo, com a intenção de, por exemplo, possivelmente encerrar o estudo mais cedo.
De acordo com Piantadosi, S. ( Ensaios clínicos - uma perspectiva metodológica ): " A estimativa de um efeito do tratamento será enviesada quando um ensaio for encerrado em um estágio inicial. Quanto mais cedo a decisão, maior o viés " .
Você pode me explicar essa afirmação? Eu posso entender facilmente que a precisão será afetada, mas a alegação sobre o viés não é óbvia para mim ...
clinical-trials
bias
ocram
fonte
fonte
Respostas:
Antes de tudo, é necessário observar o contexto: isso só se aplica quando o estudo foi interrompido precocemente devido ao monitoramento intermediário que mostra eficácia / futilidade, não por algum motivo externo aleatório. Nesse caso, a estimativa do tamanho do efeito será enviesada em um sentido completamente estatístico. Se você parou para obter eficácia, o efeito estimado será muito alto (supondo que seja positivo); se você parou para obter futilidade, será muito baixo.
Piantodosi também fornece uma explicação intuitiva (Seção 10.5.4 da minha edição). Suponha que a verdadeira diferença de duas maneiras seja 1 unidade. Quando você executa muitas tentativas e as observa no seu tempo de análise intermediária, algumas delas terão observado tamanhos de efeito muito acima de 1, algumas bem abaixo de uma e mais ou menos uma - a distribuição será ampla, mas simétrica. O tamanho estimado do efeito neste momento não seria muito preciso, mas seria imparcial. No entanto, você só para e relata um tamanho de efeito se a diferença for significativa (ajustada para vários testes), ou seja, a estimativa está no lado alto. Em todos os outros casos, você continua e não informa uma estimativa. Isso significa que, dependendo de ter parado cedo, a distribuição do tamanho do efeito não é simétrica e seu valor esperado está acima do valor real da estimativa.
O fato de esse efeito ser mais severo no início vem do obstáculo maior para interromper o teste, portanto uma parte maior da distribuição é descartada durante o condicionamento.
fonte
Aqui está uma ilustração de como o viés pode surgir nas conclusões e por que pode não ser a história completa. Suponha que você tenha um teste seqüencial de um medicamento que se espera tenha um efeito positivo (+1), mas que possa ter um efeito negativo (-1). Cinco cobaias são testadas uma após a outra. A probabilidade desconhecida de um resultado positivo em um único caso é de fato e um resultado negativo134 .1 14
Então, após cinco tentativas, as probabilidades dos diferentes resultados são
portanto, a probabilidade de um resultado positivo geral é 918/1024 = 0,896, e o resultado médio é +2,5. Dividindo pelas 5 tentativas, é uma média de um resultado de +0,5 por tentativa.
É a figura imparcial, como também é .+ 1 × 34- 1 × 14
Suponha que, a fim de proteger porquinhos-da-índia, o estudo seja encerrado se, em qualquer estágio, o resultado cumulativo for negativo. Então as probabilidades se tornam
portanto, a probabilidade de um resultado positivo geral é 702/1024 = 0,6855 e o resultado médio é +1,953. Se observarmos o valor médio do resultado por tentativa no cálculo anterior, ou seja, usar ,+3+ 55 ,+1+ 35 ,-1+ 15 ,-1- 15 e-1- 13 , obteríamos +0,184.- 11 1
Esses são os sentidos nos quais há viés ao parar no início do segundo esquema, e o viés está na direção prevista. Mas não é a história completa.
Por que whuber e probabilityislogic pensam que parar cedo deve produzir resultados imparciais? Sabemos que o resultado esperado dos ensaios no segundo esquema é +1.953. O número esperado de tentativas acaba sendo 3,906. Assim, dividindo um pelo outro, obtemos +0,5, exatamente como antes e o que foi descrito como imparcial.
fonte
Bem, meu conhecimento sobre isso vem da oração harveiana em 2008 http://bookshop.rcplondon.ac.uk/details.aspx?e=262 Essencialmente, para o melhor de minha lembrança, os resultados serão enviesados, pois 1) parando cedo geralmente significa que o tratamento foi mais ou menos eficaz do que se esperava e, se isso for positivo, você poderá aproveitar o acaso. Acredito que os valores de p sejam calculados com base no tamanho da amostra planejado (mas eu posso estar errado nisso) e também se você estiver constantemente verificando seus resultados para ver se algum efeito foi mostrado, será necessário corrigir várias comparações para garantir que você não esteja apenas encontrando um efeito casual. Por exemplo, se você verificar 20 vezes os valores de p abaixo de 0,05 e, em termos estatísticos, é quase certo que encontrará um resultado significativo.
fonte
Eu discordaria dessa afirmação, a menos que por "viés" Piantadosi signifique a parte da precisão que é comumente chamada de viés. A inferência não será "tendenciosa" porque você optou por parar por si mesma: será "tendenciosa" porque você possui menos dados. O chamado "princípio da verossimilhança" afirma que a inferência deve depender apenas dos dados observados, e não dos dados que poderiam ter sido observados, mas não eram. O LP diz
fonte
não vai ser inclinado (no "sentido estatístico") se a interrupção de estudos não é aleatória.
Em um conjunto de experimentos concluídos, os resultados "iniciais" de (a) alguns experimentos que acabam encontrando "nenhum efeito" mostrarão algum efeito (como resultado do acaso) eb) alguns experimentos que acabam encontrando um efeito mostrará "sem efeito" (provavelmente como resultado da falta de energia). Em um mundo em que você encerra os testes, se você parar (a) com mais frequência do que (b), você terminará a execução de estudos com viés a favor de encontrar um efeito. (A mesma lógica se aplica aos tamanhos dos efeitos ; encerrar os estudos que mostram efeito "maior que o esperado" mais cedo do que os que mostram "como esperado ou menor" aumentará a contagem de descobertas de "grande efeito").
Se, de fato, os ensaios médicos são encerrados quando os resultados iniciais mostram um efeito positivo - a fim de disponibilizar o tratamento para indivíduos que tomam placebo ou outros - mas não quando os resultados iniciais são inconclusivos, haverá mais erros do tipo 1 nesses testes do que haveria se todas as experiências fossem concluídas. Mas isso não significa que a prática esteja errada; moralmente, o custo do erro do tipo 1 pode ser menor do que negar o tratamento tão rapidamente quanto seria o caso de tratamentos que realmente mostrariam funcionar no final de todo o teste.
fonte