Por que o teste de Mantel é preferível ao de Moran?

37

O teste de Mantel é amplamente utilizado em estudos biológicos para examinar a correlação entre a distribuição espacial dos animais (posição no espaço) com, por exemplo, sua relação genética, taxa de agressão ou algum outro atributo. Muitos periódicos bons estão usando ( PNAS, Comportamento Animal, Ecologia Molecular ... ).

Eu fabriquei alguns padrões que podem ocorrer na natureza, mas o teste de Mantel parece ser bastante inútil para detectá-los. Por outro lado, os de I de Moran obtiveram melhores resultados (consulte os valores de p em cada gráfico) .

Por que os cientistas não usam o eu de Moran? Existe algum motivo oculto que eu não vejo? E se houver algum motivo, como posso saber (como as hipóteses devem ser construídas de maneira diferente) usar adequadamente o teste de Mantel ou de Moran? Um exemplo da vida real será útil.

Imagine esta situação: existe um pomar (17 x 17 árvores) com um corvo em cada árvore. Níveis de "ruído" para cada corvo estão disponíveis e você deseja saber se a distribuição espacial dos corvos é determinada pelo ruído que eles produzem.

Existem (pelo menos) 5 possibilidades:

  1. "Aves de uma pluma voam juntas." Quanto mais os corvos são semelhantes, menor a distância geográfica entre eles (cluster único) .

  2. "Aves de uma pluma voam juntas." Novamente, quanto mais semelhantes forem os corvos, menor será a distância geográfica entre eles (vários aglomerados), mas um aglomerado de corvos barulhentos não tem conhecimento sobre a existência do segundo aglomerado (caso contrário, eles se fundiriam em um grande aglomerado).

  3. "Tendência monotônica."

  4. "Os opostos se atraem." Corvos semelhantes não podem se suportar.

  5. "Padrão aleatório". O nível de ruído não tem efeito significativo na distribuição espacial.

Para cada caso, criei um gráfico de pontos e usei o teste de Mantel para calcular uma correlação (não é surpresa que seus resultados não sejam significativos, eu nunca tentaria encontrar associação linear entre esses padrões de pontos).

insira a descrição da imagem aqui


Dados de exemplo: (compactado possível)

r.gen   <- seq(-100,100,5)
r.val   <- sample(r.gen, 289, replace=TRUE)
z10     <- rep(0, times=10)
z11     <- rep(0, times=11)
r5      <- c(5,15,25,15,5)
r71     <- c(5,20,40,50,40,20,5)
r72     <- c(15,40,60,75,60,40,15)
r73     <- c(25,50,75,100,75,50,25)
rbPal   <- colorRampPalette(c("blue","red"))
my.data <- data.frame(x = rep(1:17, times=17),y = rep(1:17, each=17),
             c1=c(rep(0,times=155),r5,z11,r71,z10,r72,z10,r73,z10,r72,z10,r71,
             z11,r5,rep(0, times=27)),c2 = c(rep(0,times=19),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=29),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=27)),c3 = c(seq(20,100,5),
             seq(15,95,5),seq(10,90,5),seq(5,85,5),seq(0,80,5),seq(-5,75,5),
             seq(-10,70,5),seq(-15,65,5),seq(-20,60,5),seq(-25,55,5),seq(-30,50,5),
             seq(-35,45,5),seq(-40,40,5),seq(-45,35,5),seq(-50,30,5),seq(-55,25,5),
             seq(-60,20,5)),c4 = rep(c(0,100), length=289),c5 = sample(r.gen, 289, 
             replace=TRUE))

# adding colors
my.data$Col1 <- rbPal(10)[as.numeric(cut(my.data$c1,breaks = 10))]
my.data$Col2 <- rbPal(10)[as.numeric(cut(my.data$c2,breaks = 10))]
my.data$Col3 <- rbPal(10)[as.numeric(cut(my.data$c3,breaks = 10))]
my.data$Col4 <- rbPal(10)[as.numeric(cut(my.data$c4,breaks = 10))]
my.data$Col5 <- rbPal(10)[as.numeric(cut(my.data$c5,breaks = 10))]

Criando matriz de distâncias geográficas (para I de Moran é invertida):

point.dists           <- dist(cbind(my.data$x, my.data$y))
point.dists.inv       <- 1/point.dists
point.dists.inv       <- as.matrix(point.dists.inv)
diag(point.dists.inv) <- 0

Criação de plotagem:

X11(width=12, height=6)
par(mfrow=c(2,5))
par(mar=c(1,1,1,1))

library(ape)
for (i in 3:7) {
  my.res <- mantel.test(as.matrix(dist(my.data[ ,i])), as.matrix(point.dists))
  plot(my.data$x,my.data$y,pch=20,col=my.data[ ,c(i+5)], cex=2.5, xlab="", 
       ylab="", xaxt="n", yaxt="n", ylim=c(-4.5,17))
  text(4.5, -2.25, paste("Mantel's test", "\n z.stat =", round(my.res$z.stat, 
   2), "\n p.value =", round(my.res$p, 3)))

  my.res <- Moran.I(my.data[ ,i], point.dists.inv)
  text(12.5, -2.25, paste("Moran's I", "\n observed =", round(my.res$observed, 
   3), "\n expected =",round(my.res$expected,3), "\n std.dev =", 
       round(my.res$sd,3), "\n p.value =", round(my.res$p.value, 3)))
}

par(mar=c(5,4,4,2)+0.1)

for (i in 3:7) {
  plot(dist(my.data[ ,i]), point.dists,pch = 20, xlab="geographical distance", 
       ylab="behavioural distance")
}

Nos exemplos do site de ajuda estatística da UCLA, os dois testes são usados ​​exatamente nos mesmos dados e exatamente na mesma hipótese, o que não ajuda muito (cf. Teste de Mantel , I de Moran ).

Resposta ao IM Você escreveu:

... [Mantel] testa se corvos silenciosos estão localizados perto de outros corvos silenciosos, enquanto corvos barulhentos têm vizinhos barulhentos.

Eu acho que essa hipótese NÃO poderia ser testada pelo teste de Mantel . Em ambas as parcelas, a hipótese é válida. Mas se você supor que um cluster de corvos não barulhentos pode não ter conhecimento sobre a existência de um segundo cluster de corvos não barulhentos - o teste de Mantels é novamente inútil. Essa separação deve ser muito provável por natureza (principalmente quando você está realizando coleta de dados em maior escala).

insira a descrição da imagem aqui

Ladislav Naďo
fonte

Respostas:

19

Teste de Mantel e de Moran, refiro-me a dois conceitos muito diferentes.

A razão para usar o I de Moran é a questão da autocorrelação espacial: correlação de uma variável consigo mesma através do espaço. Utiliza-se o I de Moran quando queremos saber em que medida a ocorrência de um evento em uma unidade regional torna mais provável ou improvável a ocorrência de um evento em uma unidade regional vizinha. Em outras palavras (usando o seu exemplo): se houver um corvo barulhento em uma árvore, qual a probabilidade ou improvável de haver outros corvos barulhentos na vizinhança? A hipótese nula para I de Moran não é autocorrelação espacial na variável de interesse.

A razão para usar o teste de Mantel é a questão de semelhanças ou diferenças entre as variáveis. Utiliza-se o teste de Mantel quando se quer saber se amostras semelhantes em termos das variáveis ​​preditoras (espaço) também tendem a ser semelhantes em termos da variável dependente (espécie). Para simplificar: as amostras que são próximas também são composicionalmente semelhantes e são amostras espacialmente distantes uma da outra também composicionalmente diferentes? Usando o seu exemplo: ele testa se corvos silenciosos estão localizados perto de outros corvos silenciosos, enquanto corvos barulhentos têm vizinhos barulhentos. A hipótese nula não tem relação entre a localização espacial e o VD.
Além disso, o teste de Mantel parcial permite comparar duas variáveis ​​enquanto controla para uma terceira.
Por exemplo, é necessário o teste de Mantel quando comparado

  • Dois grupos de organismos, que formam o mesmo conjunto de unidades de amostra;
  • Estrutura da comunidade antes e depois da perturbação;
  • Distância genética / ecológica e distância geográfica.

Aqui está uma boa discussão sobre o teste Mantel e sua aplicação.

(Editado em resposta aos novos exemplos de Ladislav Nado)

Se eu puder adivinhar, a razão da sua confusão é que você continua pensando em espaço e ruído em seus exemplos, seja como duas variáveis ​​contínuas ou como uma matriz de distância (posição no espaço) e uma variável contínua (ruído). De fato, para analisar semelhanças entre duas dessas variáveis, deve-se pensar em ambas como matrizes de distância . Isso é:

  • uma matriz (por exemplo, para espaço) descreve as diferenças para cada par de coordenadas geográficas. O valor para 2 corvos sentados um ao lado do outro é menor que o valor dos corvos sentados distantes;
  • outra matriz (ambiental, genética ou qualquer outra estrutura) descreve as diferenças entre os resultados medidos em determinados pontos. O valor para 2 corvos com um nível de ruído semelhante (não importa se eles são silenciosos ou barulhentos - é apenas uma medida de semelhança!) É menor que o valor para um par de corvos com níveis diferentes de ruído.

Em seguida, o teste de Mantel calcula o produto cruzado dos valores correspondentes nessas duas matrizes. Deixe-me enfatizar novamente que a estatística de Mantel é a correlação entre duas matrizes de distância e não é equivalente à correlação entre as variáveis , usadas para formar essas matrizes.

Agora vamos pegar duas estruturas que você mostrou nas figuras A e B.
Na figura A, a distância em cada par de corvos corresponde a semelhanças no nível de ruído. Corvos com pequenas diferenças em seu nível de ruído (cada corvo quieto vs. outro corvo silencioso, cada corvo barulhento vs. outro corvo barulhento) ficam próximos, enquanto todo e qualquer par de corvos com grande diferença em seu nível de ruído (um corvo silencioso contra um corvo barulhento) fique longe um do outro. O teste de Mantel mostra corretamente que existe uma correlação espacial entre as duas matrizes.
Na figura B, no entanto, a distância entre os corvos nãocorrespondem às semelhanças em seu nível de ruído. Enquanto todos os corvos barulhentos ficam juntos, corvos quietos podem ou não ficar perto. De fato, a distância em alguns pares de corvos diferentes (um quieto + um barulhento) é menor que a distância para alguns pares de corvos semelhantes (quando ambos estão quietos).
Não há evidências na figura B de que, se um pesquisador pegar dois corvos semelhantes aleatoriamente, eles serão vizinhos. Não há evidências de que se um pesquisador pegar dois corvos vizinhos (ou não tão distantes) aleatoriamente, eles seriam semelhantes. Portanto, a reivindicação inicial On both plots the hypothesis validestá incorreta. A estrutura como na figura B não mostra correlação espacial entre as duas matrizes e, consequentemente, falha no teste de Mantel.

Obviamente, existem diferentes tipos de estruturas (com um ou mais grupos de objetos semelhantes ou sem fronteiras claras), na realidade. E o teste Mantel é perfeitamente aplicável e muito útil para testar o que ele testa. Se eu puder recomendar outra boa leitura, este artigo usa dados reais e discute o I de Moran, o c de Geary e o teste de Mantel em termos bastante simples e compreensíveis.

Espero que tudo esteja um pouco mais claro agora; no entanto, posso expandir essa explicação se você achar que ainda falta algo.

EU ESTOU
fonte
11
obrigado por sua resposta, mas acho que a hipótese que você escreve (da hipótese do teste Mantel da vida real) não é útil com dados da vida real. Acrescento minha resposta a você acima, ficarei muito feliz se você responder a ela. Talvez eu esteja errado.
Ladislav Naďo
@Ladislav Nado Atualizei a resposta. Por favor, não hesite em pedir mais explicações, se necessário.
IM
Muito obrigado, quando analisei os artigos que você recomendou que finalmente entendi.
Ladislav Naďo 5/11
11
@LadislavNado Great! Feliz por ajudar.
IM