Me deparei com um estudo em que pacientes, com mais de 50 anos, eram pseudo-randomizados por ano de nascimento. Se o ano de nascimento fosse um número par, cuidados usuais, se um número ímpar, intervenção.
É mais fácil de implementar, mais difícil de subverter (é fácil verificar qual tratamento um paciente deveria receber), é fácil lembrar (a tarefa durou vários anos). Mas ainda assim, não gosto, sinto que a randomização adequada teria sido melhor. Mas não sei explicar o porquê.
Estou errado ao sentir isso ou há uma boa razão para preferir a aleatorização "real"?
experiment-design
clinical-trials
random-allocation
Jeremy Miles
fonte
fonte
Respostas:
Você está certo em ser cético. Em geral, deve-se usar a randomização 'real', porque normalmente não se tem todo o conhecimento sobre fatores relevantes (não observáveis). Se um desses não observáveis estiver correlacionado com a idade ser ímpar ou par, também será correlacionado com se eles receberam ou não tratamento. Se for esse o caso, não podemos identificar o efeito do tratamento: os efeitos que observamos podem ser devidos ao tratamento ou ao (s) fator (es) não observado (s).
Isso não é um problema com a randomização real, onde não esperamos nenhuma dependência entre tratamento e não observáveis (embora, é claro, para amostras pequenas, possa estar lá).
Para construir uma história de por que esse procedimento de randomização pode ser um problema, suponha que o estudo incluísse apenas indivíduos que tinham entre 17 e 18 anos de idade quando, digamos, a guerra do Vietnã começou. Com 17 anos, não havia chance de ser recrutado (corrija-me se eu estiver errado nisso), enquanto havia essa chance aos 18 anos. Supondo que a chance não fosse desprezível e que a experiência de guerra mudasse as pessoas, isso implica que, anos depois, esses dois grupos são diferentes, apesar de terem apenas um ano de diferença. Então, talvez o tratamento (droga) pareça não funcionar, mas porque apenas o grupo com veteranos do Vietnã o recebeu, isso pode ser devido ao fato de não funcionar com pessoas com TEPT (ou outros fatores relacionados a sendo um veterano). Em outras palavras, você precisa que os dois grupos (tratamento e controle) sejam idênticos, exceto o tratamento, para identificar o efeito do tratamento.
Portanto, a menos que você possa descartar que não há diferenças não observadas entre os grupos (mas como você faz isso se não for observado?), A randomização real é preferível.
fonte
É um bom exercício para defender pontos de vista contrários de tempos em tempos, então, deixe-me começar oferecendo algumas razões a favor dessa forma de pseudo-randomização. Eles são, principalmente, que é um pouco diferente de qualquer outra forma de amostragem sistemática , como obter amostras de meios ambientais em pontos de uma grade no campo ou amostrar todas as outras árvores em um pomar e, portanto, essa amostragem pode desfrutar de vantagens comparáveis. .
A analogia aqui é perfeita: a idade foi "dividida" por ano, começando na origem de zero e a atribuição aos grupos alternados ao longo dessa grade (unidimensional). Algumas vantagens dessa abordagem são garantir ampla e uniforme dispersão da amostra pelo campo ou pomar (ou idades, neste caso), o que ajuda a nivelar as influências relacionadas à localização (ou ao tempo). Isso pode ser especialmente útil quando a teoria sugere que a localização é o fator predominante na variação da resposta. Além disso, exceto por amostras realmente pequenas, analisando os dados como seeles eram uma amostra aleatória simples introduz um erro relativamente pequeno. Além disso, é possível alguma aleatorização: no campo, podemos escolher aleatoriamente a origem e a orientação da grade. No presente caso, podemos pelo menos randomizar se os anos pares são controles ou sujeitos de tratamento.
Outra vantagem da amostragem em grade é detectar variação localizada. No campo, isso seria "bolsões" de respostas incomuns. Estatisticamente, podemos pensar nelas como manifestações de correlação espacial. Na situação atual, se houver alguma chance de uma faixa etária relativamente estreita experimentar respostas incomuns, o design com grade é uma excelente opção, porque um design puramente aleatório pode por acaso conter grandes lacunas nas idades dentro de um dos grupos. (Mas um design melhor pode ser estratificar: use a paridade etária para formar dois estratos analíticos e, então, independentemente dentro de cada estrato, randomize os pacientes em grupos de controle e tratamento.)
fonte
Concordo que o exemplo que você dá é bastante inócuo, mas ...
Se os agentes envolvidos (a pessoa que está realizando a intervenção ou as pessoas que estão recebendo a intervenção) ficarem cientes do esquema de atribuição, eles poderão tirar proveito dele. Essa auto seleção deve ser bastante óbvia porque é problemática na maioria dos projetos experimentais.
Um exemplo que conheço na criminologia é assim; O experimento teve como objetivo testar o efeito dissuasor de uma noite na prisão após uma disputa doméstica versus apenas pedir ao autor que deixasse a noite. Os oficiais receberam um livreto de folhas e a cor da folha atual na parte superior destinava-se a identificar qual tratamento o criminoso. no incidente em particular deveria receber.
O que acabou acontecendo foi que os policiais desobedeceram intencionalmente o desenho do estudo e escolheram uma folha com base nas preferências pessoais para o que deveria ser feito com o criminoso. Não é de se estranhar suspeitar de falsificações semelhantes de anos, pelo menos possível no seu exemplo.
fonte
A randomização completa com base na distribuição aleatória não é previsível; no seu caso, sabe-se que um caso seria atribuído à Intervenção ou Controle antes da confirmação da elegibilidade.
fonte