Fórmula de tamanho de amostra para um teste F?

12

Gostaria de saber se existe uma fórmula de tamanho de amostra como a fórmula de Lehr que se aplica a um teste F? A fórmula de Lehr para testes t é n=16/Δ2 , onde Δ é o tamanho do efeito ( por exemplo, Δ=(μ1μ2)/σ ). Isso pode ser generalizado para n=c/Δ2 que é uma constante que depende da taxa do tipo I, da potência desejada e se alguém está realizando um teste unilateral ou bilateral.c

Estou procurando uma fórmula semelhante para um teste F. Minha estatística de teste é distribuída, sob a alternativa, como um F não central com graus de liberdade e parâmetro de não centralidade , em que depende apenas dos parâmetros populacionais que são desconhecidos, mas têm algum valor. . O parâmetro é fixado pelo experimento é o tamanho da amostra. Idealmente, estou procurando uma fórmula (de preferência bem conhecida) da forma que c depende apenas da taxa do tipo I e da potência.n λk,nnλk n n = cλkn c

n=cg(k,λ)
c

O tamanho da amostra deve satisfazer

F(F1(1α;k,n,0);k,n,nλ)=β,
onde F(x;k,n,δ) é o CDF de um F não central com k,n dof e parâmetro de não centralidade δ e α,β são as taxas do tipo I e do tipo II. Podemos assumir que kn , ou seja , n precisa ser 'suficientemente grande'.

Minhas tentativas de brincar com isso em R não foram frutíferas. Vi g(k,λ)=λ/k+1 sugerido, mas os ajustes não pareceram muito bons.

edit: originalmente eu havia afirmado vagamente que o parâmetro de não centralidade 'depende' do tamanho da amostra. Pensando bem, achei isso muito confuso, deixando a relação clara.

Além disso, eu posso calcular o valor de exatamente resolvendo a equação implícita por meio de um localizador de raiz ( por exemplo, o método de Brent). Estou procurando uma equação para guiar minha intuição e usá-la como regra geral.n

shabbychef
fonte
1
Para esclarecer, é correto que você já consiga obter o necessário , mas está procurando uma fórmula geral? Eu ficaria muito surpreso se houver uma fórmula geral útil. n
mark999 22/05

Respostas:

1

Gostaria de saber se existe uma fórmula de tamanho de amostra como a fórmula de Lehr que se aplica a um teste F?

A página " Ferramentas elétricas para epidemiologistas " explica:

  • Diferença entre dois meios (Lehr):

    Digamos, por exemplo, que você queira demonstrar uma diferença de 10 pontos no QI entre dois grupos, um dos quais exposto a uma potencial toxina e o outro não. Usando um QI médio da população de 100 e um desvio padrão de 20:

    ngroup=16(10090/20)2

    ngroup=16(.5)2=64
  • Variação percentual em médias

    Os pesquisadores clínicos podem estar mais à vontade para pensar em termos de mudanças percentuais, em vez de diferenças de média e variabilidade. Por exemplo, alguém pode estar interessado em uma diferença de 20% entre dois grupos de dados com cerca de 30% de variabilidade. O professor van Belle apresenta uma abordagem elegante para esses tipos de números que usa o coeficiente de variação (cv) 4 e traduz a variação percentual em uma razão de médias.

    A variação na escala logarítmica (consulte o capítulo 5 em van Belle) é aproximadamente igual ao coeficiente de variação na escala original; portanto, a fórmula de Lehr pode ser traduzida para uma versão que usa cv

    ngroup=16(c.v.)2(ln(μ0)ln(μ1))2

    Podemos então usar a variação percentual como a razão de médias, onde

    r.m.=μ0μ1μ0=1μ1μ0

    para formular uma regra de ouro:

    ngroup=16(c.v.)2(ln(r.m.))2

    No exemplo acima, uma mudança de 20% se traduz em uma razão de médias de 1 -20 = 0,80. (Uma alteração de 5% resultaria em uma razão de médias de 1 −0,05 = 0,95; uma alteração de 35% 1 − 0,35 = 0,65 e assim por diante.) Portanto, o tamanho da amostra para um estudo que procura demonstrar uma Uma mudança de 20% nas médias com dados que variam cerca de 30% em torno das médias seria

    ngroup=16(.3)2(ln(.8))2=29

An R function based on this rule would be:

1   nPC<-function(cv, pc){
2       x<-16*(cv)^2/((log((1-pc)))^2)
3       print(x)
4   }

Say you were interested in a 15% change from one group to another, but were uncertain about how the data varied. You could look at a range of values for the coefficient of variation:

1   a<-c(.05,.10,.15,.20,.30,.40,.50,.75,1)
2   nPC(a,.15)

You could use this to graphically display your results:

1   plot(a,nPC(a,.15),  ylab="Number in Each Group", 
2   xlab="By Varying Coefficent of Variation", 
3   main="Sample Size Estimate for a 15% Difference")

Veja também: iSixSigma " Como determinar o tamanho da amostra " e RaoSoft " Calculadora de tamanho de amostra on-line ".

Rob
fonte