Estou executando comparações post-hoc após um teste de Kruskal-Wallis. Estou usando o pacote PMCMR .
> posthoc.kruskal.nemenyi.test( preference ~ instrument)
Pairwise comparisons using Tukey and Kramer (Nemenyi) test
with Tukey-Dist approximation for independent samples
data: preference by instrument
Cello Drums Guitar
Drums 0.157 - -
Guitar 0.400 0.953 -
Harp 0.013 0.783 0.458
P value adjustment method: none
Warning message:
In posthoc.kruskal.nemenyi.test.default(c(50L, 50L, 50L, 50L, 49L, :
Ties are present, p-values are not corrected.
Estou confuso com a mensagem de aviso. Alguém pode explicar o que significa e como posso corrigi-lo?
posthoc.kruskal.nemenyi.test()
. Então, ajustei os vínculos executando dados x, ties.method = "average") antes de executar posthoc.kruskal.nemenyi.test (dados y) novamente, mas ainda recebo o mesmo aviso em relação a " Laços estão presentes ". Isso é um problema geral ou esse problema deriva dos meus dados?Respostas:
Um empate significa que você tem várias observações que compartilham o mesmo valor (daí a mesma classificação). Por exemplo, uma amostra consiste em observações: . " " e " " são dois vínculos, em que tem réplicas de e tem réplicas de . Essa amostra corresponde às estatísticas de classificação: .1,3,3,5,10,10,10 3 10 3 2 10 3 1,2,2,4,5,5,5
Quando os laços estão presentes, geralmente precisamos quebrá-lo (se não, você provavelmente receberá a mensagem de aviso como mostrou). E, convencionalmente, quebramos os laços nas estatísticas de classificação, em contraste com os nas observações originais. Como o teste de Kruskal-Wallis está usando estatísticas de classificação, é suficiente responder à sua pergunta restringindo o escopo às estatísticas de classificação.
Dois métodos de desempate são comuns, um é "rompimento de laços aleatoriamente". Nomeadamente, nós regeneramos diferentes classificações aleatoriamente entre os laços. Continuando o exemplo acima, para o empate " ", podemos desenhar dois números sem substituição do conjunto e atribuí-los à segunda e terceira posições, por exemplo, "3, 2" . Da mesma forma, podemos fazer isso pelo empate . Uma possível estatística de classificação ajustada pode ser , portanto, os empates foram interrompidos. A desvantagem desse método é que você pode obter estatísticas de teste diferentes entre diferentes análises, pois o desempate é aleatório.{ 2 , 3 } 10 1 , 3 , 2 , 4 , 6 , 5 , 72,2 {2,3} 10 1,3,2,4,6,5,7
O segundo método é "média". Ou seja, a média atribui a cada elemento vinculado a classificação "média". Usando esse método, as estatísticas de classificação originais se tornam: . Esse método essencialmente ajusta os laços em vez de quebrá-los.1,2.5,2.5,4,6,6,6
No software, você pode especificar opções de desempate para as quais deve consultar a documentação da função.
Para uma discussão semelhante sobre esse assunto, consulte Como funciona o argumento ties.method da função de classificação de R?
fonte