Entendendo a mensagem de aviso "Laços estão presentes" no post hoc de Kruskal-Wallis

8

Estou executando comparações post-hoc após um teste de Kruskal-Wallis. Estou usando o pacote PMCMR .

> posthoc.kruskal.nemenyi.test( preference ~ instrument)

    Pairwise comparisons using Tukey and Kramer (Nemenyi) test  
                   with Tukey-Dist approximation for independent samples 

data:  preference by instrument 

       Cello Drums Guitar
Drums  0.157 -     -     
Guitar 0.400 0.953 -     
Harp   0.013 0.783 0.458 

P value adjustment method: none 

Warning message:
In posthoc.kruskal.nemenyi.test.default(c(50L, 50L, 50L, 50L, 49L,  :
  Ties are present, p-values are not corrected.

Estou confuso com a mensagem de aviso. Alguém pode explicar o que significa e como posso corrigi-lo?

dB '
fonte
1
Eu tive o mesmo aviso ao executar posthoc.kruskal.nemenyi.test(). Então, ajustei os vínculos executando dados x, ties.method = "average") antes de executar posthoc.kruskal.nemenyi.test (dados y) novamente, mas ainda recebo o mesmo aviso em relação a " Laços estão presentes ". Isso é um problema geral ou esse problema deriva dos meus dados? x<rank(datax data
Constanze

Respostas:

5

Um empate significa que você tem várias observações que compartilham o mesmo valor (daí a mesma classificação). Por exemplo, uma amostra consiste em observações: . " " e " " são dois vínculos, em que tem réplicas de e tem réplicas de . Essa amostra corresponde às estatísticas de classificação: .1,3,3,5,10,10,10310321031,2,2,4,5,5,5

Quando os laços estão presentes, geralmente precisamos quebrá-lo (se não, você provavelmente receberá a mensagem de aviso como mostrou). E, convencionalmente, quebramos os laços nas estatísticas de classificação, em contraste com os nas observações originais. Como o teste de Kruskal-Wallis está usando estatísticas de classificação, é suficiente responder à sua pergunta restringindo o escopo às estatísticas de classificação.

Dois métodos de desempate são comuns, um é "rompimento de laços aleatoriamente". Nomeadamente, nós regeneramos diferentes classificações aleatoriamente entre os laços. Continuando o exemplo acima, para o empate " ", podemos desenhar dois números sem substituição do conjunto e atribuí-los à segunda e terceira posições, por exemplo, "3, 2" . Da mesma forma, podemos fazer isso pelo empate . Uma possível estatística de classificação ajustada pode ser , portanto, os empates foram interrompidos. A desvantagem desse método é que você pode obter estatísticas de teste diferentes entre diferentes análises, pois o desempate é aleatório.{ 2 , 3 } 10 1 , 3 , 2 , 4 , 6 , 5 , 72,2{2,3}101,3,2,4,6,5,7

O segundo método é "média". Ou seja, a média atribui a cada elemento vinculado a classificação "média". Usando esse método, as estatísticas de classificação originais se tornam: . Esse método essencialmente ajusta os laços em vez de quebrá-los.1,2.5,2.5,4,6,6,6

No software, você pode especificar opções de desempate para as quais deve consultar a documentação da função.

Para uma discussão semelhante sobre esse assunto, consulte Como funciona o argumento ties.method da função de classificação de R?

Zhanxiong
fonte