Meu texto não paramétrico , Estatísticas Práticas Não Paramétricas , geralmente fornece fórmulas limpas para expectativas, variações, estatísticas de testes e similares, mas inclui a ressalva de que isso só funciona se ignorarmos laços. Ao calcular a estatística U de Mann-Whitney, é recomendável que você jogue pares empatados ao comparar qual é maior.
Entendo que os laços não nos dizem muito sobre qual população é maior (se é nisso que estamos interessados), já que nenhum grupo é maior que o outro, mas não parece que isso importaria ao desenvolver distribuições assintóticas.
Por que, então, é um dilema lidar com laços em alguns procedimentos não paramétricos? Existe uma maneira de extrair qualquer informação útil dos laços, em vez de simplesmente jogá-los fora?
EDIT: No que diz respeito ao comentário do @ whuber, verifiquei minhas fontes novamente, e alguns procedimentos usam uma média de classificações em vez de reduzir completamente os valores vinculados. Embora isso pareça mais sensato em relação à retenção de informações, também me parece que carece de rigor. O espírito da questão ainda permanece, no entanto.
fonte
Respostas:
A maior parte do trabalho sobre não paramétricos foi originalmente feita assumindo que havia uma distribuição contínua subjacente na qual os laços seriam impossíveis (se medidos com precisão suficiente). A teoria pode então se basear nas distribuições de estatísticas de pedidos (que são muito mais simples sem vínculos) ou em outras fórmulas. Em alguns casos, a estatística parece ser aproximadamente normal, o que facilita as coisas. Quando os empates são introduzidos porque os dados foram arredondados ou são naturalmente discretos, as suposições padrão não se mantêm. A aproximação ainda pode ser boa o suficiente em alguns casos, mas não em outros; geralmente, a coisa mais fácil a fazer é apenas avisar que essas fórmulas não funcionam com vínculos.
Existem ferramentas para alguns dos testes não paramétricos padrão que calcularam a distribuição exata quando os empates estão presentes. O pacote exactRankTests para R é um exemplo.
Uma maneira simples de lidar com laços é usar testes de randomização, como testes de permutação ou inicialização. Eles não se preocupam com distribuições assintóticas, mas usam os dados como são, empates e tudo (observe que com muitos empates, mesmo essas técnicas podem ter pouca energia).
Havia um artigo há alguns anos atrás (pensei no Estatístico Americano, mas não o estou encontrando) que discutia as idéias de vínculos e algumas das coisas que você pode fazer com eles. Um ponto é que depende de qual pergunta você está fazendo, o que fazer com os laços pode ser muito diferente em um teste de superioridade vs. um teste de não inferioridade.
fonte