Número necessário de permutações para um valor p baseado em permutação

8

Se eu precisar calcular um valor baseado em permutação com nível de significância α , quantas permutações eu preciso?pα

No artigo "Testes de permutação para estudar o desempenho do classificador" , página 5:

Na prática, o limite superior é normalmente usado para determinar o número de amostras necessárias para alcançar a precisão desejada do teste.1/(2k)

... onde é o número de permutações.k

Como calculo o número de permutações necessárias a partir desta fórmula?

Netuno
fonte

Respostas:

12

Eu admito, o parágrafo pode ser confuso.

p(1p)k

Então, quantas permutações k são necessárias para obter uma estimativa confiável?

P[p3P,p+3P]

Usando o limite superior

12kp(1p)k

12kP

14P2k

Mas, como a fórmula citada representa um limite superior, essa abordagem é muito difícil.

Usando o erro no nível de significância

α

α(1α)kP

(α(1α))P2k

α[p3P,p+3P]

Estendendo o intervalo de confiança

Essa abordagem corresponde ao centro do intervalo de confiança estar no limite de decisão. Para forçar o limite superior do intervalo de confiança do estimado p estar abaixo do limiar de decisão (que é mais correto), é necessário ...

lα(1α)kP

(l)2(α(1α))P2k

onde l corresponde (veja novamente o gráfico )

| l | confidence interval |
| 1 | ~68 % |
| 2 | ~95 % |
| 3 | ~99 % |

Exemplos: Seja a precisão P desejada 0,005.

k>=10000

α=0.05k>=7600

α=0.01

Finalmente : sugiro enfatizar mais as simulações de Monte-Carlo. A Wikipedia fornece um começo.

Steffen
fonte
Obrigado, eu reed este: epibiostat.ucsf.edu/biostat/sen/statgen/… e estou tentando compará-lo com o método escrito por você. Quais são as diferenças na sua opinião?
Neptune
(1α))