Desejo saber que literatura estatística é relevante para o seguinte problema, e talvez até uma idéia de como resolvê-lo.
Imagine o seguinte problema:
Temos 4 tratamentos possíveis para algumas doenças. Para verificar qual o melhor tratamento, realizamos um teste especial. No julgamento, começamos por não ter sujeitos e, um por um, mais sujeitos são inseridos no julgamento. Cada paciente é alocado aleatoriamente em um dos 4 tratamentos possíveis. O resultado final de um tratamento é "saudável" ou "ainda está doente", e digamos que podemos saber esse resultado instantaneamente. Isso significa que, a qualquer momento, podemos criar uma tabela de contingência de dois a quatro, dizendo quantos de nossos sujeitos se enquadram em qual tratamento / resultado final.
A qualquer momento, podemos verificar a tabela de contingência (por exemplo, usando um teste do qui quadrado), para verificar se existe um tratamento estatisticamente diferente entre os 4 tratamentos possíveis. Se um deles é melhor do que todo o resto - paramos o julgamento e o escolhemos como o "vencedor". Se algum teste for pior do que os outros três, nós o abandonaremos do teste e deixaremos de administrá-lo a futuros pacientes.
No entanto, o problema aqui é como ajusto o valor-p pelo fato de o teste poder ser executado em um determinado momento, de haver correlação entre os testes e também de que a natureza adaptativa do processo manipula o processo (por Por exemplo, se algum tratamento for considerado "ruim")?
Respostas:
Esta área de ensaios clínicos sequenciais foi explorada substancialmente na literatura. Alguns dos pesquisadores mais notáveis são Scott Emerson, Tom Flemming, David DeMets, Stephen Senn e Stuart Pocock, entre outros.
É possível especificar uma "regra de gastos alfa". O termo tem sua origem na natureza de testes freqüentistas (não-pescadores), onde cada ação que aumenta o risco de um achado falso positivo deve necessariamente reduzir o poder de manter o teste do tamanho correto. No entanto, a maioria desses testes exige que as "regras de parada" sejam pré-especificadas com base nos limites de informações do estudo. (como lembrete, mais informações significam maior poder quando o nulo é falso).
Vejo
[1] www.rctdesign.org/
fonte
Parece que uma simulação está em ordem.
Meu código rápido e sujo no Matlab está abaixo. Observe que esse código está com morte encefálica e não é otimizado; tudo corre em voltas e terrivelmente lento. Provavelmente isso pode ser acelerado muito.
fonte