Deve-se sempre esperar que a tendência central (isto é, média e / ou mediana) de uma amostra com bootstrap seja semelhante ao valor observado?
Nesse caso em particular, tenho respostas distribuídas exponencialmente para sujeitos em duas condições (não realizei o experimento, só tenho os dados). Fui encarregado de ajustar o tamanho do efeito (em termos de d de Cohen, a fórmula de uma amostra, ou seja,onde é a estimativa amostral do desvio padrão da população. O fórum para isso é fornecido em Rosenthal e Rosnow (2008) na página 398, equação 13.27. Eles usam no denominador porque é historicamente correto; no entanto, a prática padrão definiu erroneamente d como usar e, portanto, segui esse erro no cálculo acima.
Eu randomizei tanto os participantes (ou seja, uma RT de participantes pode ser amostrada mais de uma vez) quanto entre os sujeitos (as amostras podem ser amostradas mais de uma vez), de modo que, mesmo que o participante 1 seja amostrado duas vezes, é improvável que o seu TR médio em ambas as amostras seja exatamente igual. Para cada conjunto de dados randomizado / reamostrado, recalculo d. Nesse caso, . O que estou observando é uma tendência para o valor observado de d de Cohen estar tipicamente mais próximo do percentil 97,5º do que do percentil 2,5º dos valores observados simulados. Também tende a estar mais próximo de 0 do que a mediana do bootstrap (de 5% a 10% da densidade da distribuição simulada).
O que pode explicar isso (tendo em mente a magnitude do efeito que estou observando)? É devido ao fato de ser 'mais fácil' na reamostragem obter variações mais extremas do que aquelas observadas em relação à extremidade das médias na reamostragem? Isso pode ser um reflexo de dados que foram excessivamente massageados / aparados seletivamente? Essa abordagem de reamostragem é igual a uma inicialização? Caso contrário, o que mais deve ser feito para criar um IC?
fonte