Por que o poder de um teste de hipótese é uma preocupação quando podemos inicializar qualquer amostra representativa para fazer com que n se aproxime do infinito?

7

Por que nos preocupamos com o poder de um teste de hipótese se não vivemos mais em uma época em que os computadores são lentos e é muito caro iniciar / executar um teste de permutação em algo que também não é paramétrico?

A análise de potência é irrelevante se eu puder inicializar o teste de hipótese de permutação?

Podemos fazer o infinito "tamanho da amostra" com a inicialização, para que a energia suba como resultado da inicialização?


fonte

Respostas:

22

A quantidade de informações relacionadas às hipóteses que você possui é simplesmente a informação nos dados originais.

A reamostragem dessas informações, seja bootstrapping, teste de permutação ou qualquer outra reamostragem, não pode adicionar informações que ainda não estavam lá.

O objetivo do bootstrapping é estimar a distribuição amostral de alguma quantidade, em essência usando o cdf da amostra como uma aproximação do cdf da população a partir do qual foi extraído.

Como normalmente entendido, cada amostra de bootstrap tem o mesmo tamanho da amostra original (já que a coleta de uma amostra maior não informa sobre a variabilidade da amostra no tamanho da amostra). O que varia é o número de novas amostras de bootstrap.

Aumentar o número de amostras de bootstrap fornece uma sensação mais "precisa" dessa aproximação, mas não adiciona nenhuma informação que ainda não estava lá.

Com um teste de autoinicialização, você pode reduzir o erro de simulação em um cálculo do valor p, mas não pode alterar o valor p subjacente que está aproximando (que é apenas uma função da amostra); sua estimativa é menos barulhenta.

Por exemplo, digamos que eu faça um teste t de uma amostra com inicialização (com uma alternativa unilateral) e veja o que acontece quando aumentamos o número de amostras de inicialização:

histogramas de distribuição de bootstrap do t-statstic, com 1000 e 10000 reamostragens de bootstrap

A linha azul muito próxima de 2 mostra a estatística t para nossa amostra, que vemos extraordinariamente alta (o valor p estimado é semelhante em ambos os casos, mas o erro padrão estimado desse valor p é cerca de 30% maior para o segundo)

Uma imagem qualitativamente semelhante - versões mais ruidosas versus menos ruidosas de formas de distribuição subjacentes idênticas - resultaria da amostragem da distribuição de permutação de algumas estatísticas também.

Vemos que a informação não mudou; a forma básica da distribuição de bootstrap da estatística é a mesma, é que temos uma ideia um pouco menos barulhenta (e, portanto, uma estimativa um pouco menos barulhenta do valor-p).

-

Fazer uma análise de energia com um teste de inicialização ou permutação é um pouco complicado, pois você precisa especificar coisas que não precisava assumir no teste, como o formato de distribuição específico da população. Você pode avaliar o poder sob alguma hipótese distributiva específica. Presumivelmente, você não tem uma idéia particularmente boa sobre o que é a distribuição ou teria sido capaz de usar essas informações para ajudar a construir o teste (por exemplo, começando com algo que teria um bom poder para uma distribuição refletindo o que você entende sobre e, talvez, um pouco mais robusto). É claro que você pode investigar uma variedade de possíveis distribuições de candidatos e uma variedade de seqüências de alternativas, dependendo das circunstâncias.

Glen_b -Reinstate Monica
fonte