ajuste do valor p para a estatística I de Moran local (LISA)

10

Estou trabalhando com algumas análises espaciais exploratórias em R usando o pacote spdep.

Encontrei uma opção para ajustar os valores- p dos indicadores locais de associação espacial (LISA) calculados usando a localmoranfunção. De acordo com os documentos, ele visa:

... ajuste do valor de probabilidade para vários testes.

Além disso, nos documentos de p.adjustSPeu li que as opções disponíveis são:

Os métodos de ajuste incluem a correção de Bonferroni ('"bonferroni"'), na qual os valores de p são multiplicados pelo número de comparações. Quatro correções menos conservadoras também estão incluídas por Holm (1979) ('holm'), Hochberg (1988) ('' hochberg ''), Hommel (1988) ('' hommel '') e Benjamini e Hochberg (1995) ('"fdr"'), respectivamente. Uma opção de passagem ('"none"') também está incluída.

Os quatro primeiros métodos são projetados para fornecer um forte controle da taxa de erro familiar. Parece não haver razão para usar a correção de Bonferroni não modificada, porque é dominada pelo método de Holm, que também é válido sob premissas arbitrárias.

Os métodos de Hochberg e Hommel são válidos quando os testes de hipóteses são independentes ou quando não estão associados negativamente (Sarkar, 1998; Sarkar e Chang, 1997). O método de Hommel é mais poderoso que o de Hochberg, mas a diferença é geralmente pequena e os valores de p de Hochberg são mais rápidos de calcular.

O método "BH" (aka "fdr") e "BY" de Benjamini, Hochberg e Yekutieli controlam a taxa de falsas descobertas, a proporção esperada de descobertas falsas entre as hipóteses rejeitadas. A taxa de descoberta falsa é uma condição menos rigorosa que a taxa de erro familiar, portanto, esses métodos são mais poderosos que os outros.

Algumas perguntas que apareceram:

  1. Em palavras simples - qual é o objetivo desse ajuste?
  2. É necessário usar essas correções?
  3. Se sim - como escolher entre as opções disponíveis?
radek
fonte
11
Migrei esta questão porque muitas delas foram abordadas aqui no CV. Veja o que você pode aprender com uma pesquisa , por exemplo.
whuber
@whuber Boa ideia. Eu não pensei no currículo, mas isso realmente parece ser um lar melhor para ele. Obrigado.
Radek

Respostas:

1

brevemente, o problema que você está enfrentando é chamado de teste de múltiplas hipóteses . Surge quando você está testando, como o nome indica, muitas hipóteses ao mesmo tempo.

Digamos que você tenha uma probabilidade determinada de rejeitar incorretamente a hipótese nula (falso positivo) de um teste, digamos 5%. À medida que você aumenta o número de conjuntos de dados que você está testando (neste caso, cada um dos conjuntos em que você aplica a estatística local de Moran), a probabilidade de observar em qualquer conjunto de dados um falso positivo aumenta, independentemente do fato de que a probabilidade de observar um falso positivo para um único conjunto de dados é o mesmo.

Existem muitas "correções" possíveis, que você encontrou, para corrigir esse problema; se você realmente precisa de uma estatística local, não pode evitá-la. Caso contrário, você pode usar a estatística global como uma única hipótese.

chuse
fonte