Teste de diferença mediana

8

Dadas amostras de duas distribuições, estou procurando um teste para diferença de mediana (ou seja, rejeito nulo em favor da evidência de que as medianas são diferentes.) Não quero assumir nada sobre as duas distribuições. Existe algum teste padrão para esta situação?

Conheço o teste mediano de Mood, mas acredito que assume que as distribuições foram alteradas. para alguns . Apoio esta afirmação com estas fontes:F2(t)=F1(ta)aR

Link1 Link2 Link3

Manuel
fonte
11
+1 @Firebug está quase correto: o teste da soma executada testa apenas a diferença mediana sob suposições adicionais rigorosas (que violam os desiderados declarados pelo OP).
Alexis
@ Alexis, é um teste de medianas quando a distribuição é simétrica; nesse caso, também é um teste de médias.
21420 AdamOf
@AdamO É um teste de medianas quando ambas as distribuições têm a mesma forma (simétricas ou não) e quando ambas as distribuições têm a mesma variação ... ou seja, é simplesmente um teste de mudança de local. (E sim, então ele passa a ser também um teste para a diferença média.)
Alexis
@ Alexis abaixo da toca do coelho. Acabei de me lembrar leitura que em docs R, então eu pensei em publicá-la haha
Firebug

Respostas:

6

Você pode considerar um teste de permutação.

median.test <- function(x,y, NREPS=1e4) {
  z <- c(x,y)
  i <- rep.int(0:1, c(length(x), length(y)))
  v <- diff(tapply(z,i,median))
  v.rep <- replicate(NREPS, {
    diff(tapply(z,sample(i),median))
  })
  v.rep <- c(v, v.rep)
  pmin(mean(v < v.rep), mean(v>v.rep))*2
}

set.seed(123)
n1 <- 100
n2 <- 200
## the two samples
x <- rnorm(n1, mean=1)
y <- rexp(n2, rate=1)
median.test(x,y)

insira a descrição da imagem aqui

Dá um valor de p bilateral de 0,1112, que é uma prova de quão ineficiente um teste mediano pode ser quando não apelamos a nenhuma tendência distributiva.

Se usarmos MLE, o IC95% da mediana da normal pode ser obtido apenas da média, já que a média é a mediana em uma distribuição normal, ou seja, de 1,00 a 1,18. O IC de 95% da mediana da exponencial pode ser enquadrado como , que pelo método delta é de 0,63 a 0,80. Portanto, o teste de Wald é estatisticamente significativo no nível 0,05, mas o teste mediano não é.log(2)/X¯

AdamO
fonte
Um aviso: "A situação é ainda pior ao basear um teste em uma diferença nas medianas da amostra, no sentido de que, independentemente do tamanho da amostra, a probabilidade de rejeição assintótica do teste de permutação será α sob condições muito rigorosas, o que significa essencialmente apenas o caso em que as distribuições subjacentes são as mesmas ". de projecteuclid.org/euclid.aos/1366138199 . Uma solução melhor, de acordo com esses autores, seria usar uma versão estudada da estatística do teste.
Julian Karls
4

Supondo que seu resultado seja ordinal ou com valor de intervalo, você pode usar o medianteste não paramétrico com k = 2. Aqui está uma descrição da implementação do Stata :

O teste mediano examina se é provável que duas ou mais amostras venham de populações com a mesma mediana. A hipótese nula é que as amostras foram retiradas de populações com a mesma mediana. A hipótese alternativa é que pelo menos uma amostra foi retirada de uma população com uma mediana diferente. O teste deve ser usado apenas com dados ordinais ou com intervalo. Suponha que haja valores de pontuação para k amostras independentes a serem comparadas. O teste mediano é realizado calculando primeiro a pontuação mediana para todas as observações combinadas, independentemente do grupo amostral. Cada pontuação é comparada com esta grande mediana calculada e é classificada como estando acima da mediana, abaixo da mediana ou igual à mediana. Observações com pontuação igual à mediana geral podem ser eliminadas, adicionadas ao grupo "acima", adicionado ao grupo "abaixo" ou dividido entre os dois grupos. Depois que todas as observações são classificadas, os dados são convertidos em uma tabela de contingência 2xk e um teste qui-quadrado de Pearson ou exato de Fisher é realizado.

Dimitriy V. Masterov
fonte
Eu acredito que este é o teste mediano de Mood. Você tem certeza de que não assume que a distribuição seja alterada?
Manuel
@ Manuel Não estou familiarizado com o teste mediano de Mood, mas parece muito semelhante ao que propus. No entanto, a suposição de mudança não aparece entre as outras no arquivo de ajuda que vinculei e não está claro para mim onde seria necessário aqui. É possível que esteja faltando alguma coisa, mas talvez você possa adicionar por que acredita que é necessário?
Dimitriy V. Masterov 6/02/19
Eu adicionei à pergunta alguns links onde eles dizem que a distribuição deslocada é necessária.
Manuel