Se algum teste paramétrico não rejeitar nulo, sua alternativa não paramétrica fará o mesmo?

12

Se se presume que testes não paramétricos têm menos poder do que suas alternativas paramétricas, isso implica que, se algum teste paramétrico não rejeita nulo, sua alternativa não paramétrica também não rejeita nulo? Como isso pode mudar se as suposições do teste paramétrico não forem atendidas e o teste for usado de qualquer maneira?

Miroslav Sabo
fonte
4
(a) se o teste A tiver uma potência menor do que o teste B em alguma circunstância presumida, isso não implica que os casos que A rejeitarão sejam um subconjunto daqueles em B (na verdade, isso não é possível em um nível de significância fixo); eles rejeitam partes diferentes (mas talvez muito sobrepostas) do espaço da amostra - sempre há casos em que cada um rejeita que o outro não. (b) Se as suposições do teste paramétrico não forem cumpridas (elas realmente são cumpridas?), então os testes paramétricos podem ter potência relativamente baixa (por exemplo, teste t vs Mann-Whitney sob caudas pesadas)
Glen_b -Reinstate Monica

Respostas:

9

Se um teste paramétrico falhar em rejeitar a hipótese nula, seu equivalente não paramétrico ainda poderá definitivamente rejeitar a hipótese nula. Como @John disse, isso geralmente ocorre quando violações de premissas que justificariam o uso do teste paramétrico. Por exemplo, se compararmos o teste t de duas amostras com o teste da soma da classificação de Wilcoxon, podemos obter essa situação se incluirmos valores discrepantes em nossos dados (com discrepantes, não devemos usar o teste de duas amostras).

#Test Data
x = c(-100,-100,rnorm(1000,0.5,1),100,100)
y = rnorm(1000,0.6,1)

#Two-Sample t-Test
t.test(x,y,var.equal=TRUE)

#Wilcoxon Rank Sum Test
wilcox.test(x,y)

Os resultados da execução do teste:

> t.test(x,y,var.equal=TRUE)

    Two Sample t-test

data:  x and y 
t = -1.0178, df = 2002, p-value = 0.3089
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -0.6093287  0.1929563 
sample estimates:
mean of x mean of y 
0.4295556 0.6377417 

> 
> wilcox.test(x,y)

    Wilcoxon rank sum test with continuity correction

data:  x and y 
W = 443175, p-value = 5.578e-06
alternative hypothesis: true location shift is not equal to 0 

fonte
9

Não.

Embora os testes paramétricos possam ser mais poderosos, esse nem sempre é o caso. Quando não é o caso, geralmente é em situações em que você não deve executar os testes paramétricos.

Mas, mesmo se você estiver coletando amostras de tamanho decente de distribuições normais com igual variação, onde o teste paramétrico tem maior poder, não garante que, para qualquer experiência em particular, um teste paramétrico não significativo signifique um teste não paramétrico não significativo. Aqui está uma simulação que apenas usa amostragem aleatória de distribuições normais e descobre que cerca de 1,8% do tempo quando p> 0,05 para um teste t que p <0,05 para um teste de Wilcoxon.

nsim <- 10000
n <- 50
cohensD <- 0.2
Y <- replicate(nsim, {
    y1 <- rnorm(n, 0, 1); y2 <- rnorm(n, cohensD, 1)
    tt <- t.test(y1, y2, var.equal = TRUE)
    wt <- wilcox.test(y1, y2)
    c(tt$p.value, wt$p.value)})
sum(Y[1,] > 0.05 & Y[2,] < 0.05) / nsim

Você pode observar que, nesta simulação, a potência do teste paramétrico é maior que o teste não paramétrico (embora sejam semelhantes).

sum(Y[1,] < 0.05) / nsim #t-test power
sum(Y[2,] < 0.05) / nsim #wilcox.test power

Mas, como é mostrado acima, isso não significa que, em todos os casos em que o teste paramétrico falha em encontrar um efeito, o teste não paramétrico também falha.

Você pode jogar com esta simulação. Faça n bem grande, digamos 1000, e diminua o tamanho do efeito, digamos 0,02 (você precisa de pouca energia para ter muitas amostras em que o teste falha). Pode-se garantir com um n de 1000 que nenhuma das amostras seria rejeitada por não-normalidade (por inspeção, não por um teste estúpido) ou por ter discrepâncias suspeitas. Ainda assim, alguns dos testes paramétricos não são significativos, enquanto os testes não paramétricos são significativos.

Você também pode querer olhar para Hunter & May (1993).

Hunter, MA, e May, RB (1993). Alguns mitos sobre testes paramétricos e não paramétricos. Canadian Psychology, 34 (4), 384-389.

John
fonte