Classificação e transformação z em vez de Wilcoxon?

8

Andrew Gelman, em uma publicação recente em seu blog, sugere o uso de uma classificação, transformando a classificação em um z-score e, em seguida, usando ferramentas e testes paramétricos em vez de executar testes não paramétricos. Eu nunca ouvi isso antes.

Uma pesquisa no Google me indicou essa função R no pacote GenABEL , que parece executar a transformação z + de um vetor de dados, mas não consegui encontrar trabalhos que avaliem ou discutam a ideia de usar testes paramétricos nos dados transformados. dos testes de Wilcoxon.

Alguém pode me apontar alguma literatura sobre esse método?

Jacques Wainer
fonte
2
Este não é um teste paramétrico. Você acabou de usar uma aproximação assintótica da distribuição nula de uma estatística baseada em classificação.
dsaxton
1
@dsaxton Em muitos casos, é um teste não paramétrico (ou melhor, uma aproximação a um). Substituir classificações por qualquer conjunto de pontuações fixo (dados os tamanhos da amostra) não altera a falta de dependência das formas de distribuição originais sob o valor nulo.
Glen_b -Reinstala Monica

Respostas:

10

(Puxa Conover [1] da estante ...)

Essa ideia é bastante antiga; remonta pelo menos a van der Waerden (1952/1953) [2] [3], que sugeriu um teste que corresponde ao Kruskal Wallis, mas com classificações substituídas por notas normais. (A idéia de usar valores normais aleatórios ordenados em vez de uma aproximação de suas expectativas ou medianas - talvez seja até um pouco mais antiga.)

De acordo com Conover, Fisher e Yates (1957) [4] sugerem substituir as observações pelas pontuações normais esperadas (ou seja, classificações transformadas) em uma variedade de testes em que a normalidade seria assumida.

A eficiência relativa assintótica no normal será 1, o que o torna bastante atraente ... no entanto, a vantagem de dizer que o Wilcoxon-Mann-Whitney (ganho de poder) - mesmo no normal - é muito pequeno, e se a distribuição for mais pesada do que o normal (por exemplo, logística), pode ser desvantajoso fazer isso. (Algumas simulações sugerem que esse é realmente o caso: a menos que a distribuição já esteja quase normal - nesse caso, não há nenhum benefício em fazer a transformação - essa transformação pode realmente perder energia.)

Chernoff e Lehmann [5] calculam o poder assintótico para uma variedade de distribuições; onde há pelo menos uma cauda muito curta (como o uniforme), o teste de pontuação normal pode ter um ARE muito melhor para uma alternativa de turno contra o Wilcoxon-Mann-Whitney - melhor do que o próprio teste t. Seus resultados concordam com minhas simulações para casos de cauda mais pesada.

Observe que no caso de duas amostras, à medida que a separação nos meios se torna grande, enquanto a amostra combinada parece bastante normal, as duas amostras não são normais:

insira a descrição da imagem aqui

Como resultado, nem todas as propriedades do teste normal serão transferidas para o teste de pontuação normal, e o comportamento em separações maiores (com amostras pequenas) pode ser um pouco contra-intuitivo.

Os testes obtidos por essa idéia são chamados coletivamente de testes de pontuação normal , cujo termo de pesquisa (via Google, por exemplo) apresenta várias referências.

Por exemplo, aqui , Richard Darlington discute fazer isso para o teste de fileiras assinadas de Wilcoxon; ele ressalta que há uma vantagem sobre o teste de classificação simples, porque reduz o número de valores vinculados da estatística de teste.

Antes de terminar de escrever as páginas, deixarei você pesquisar mais.

O Conover lista várias outras referências e tem bastante discussão, então eu definitivamente recomendo a leitura.

O argumento de Gelman, no entanto, parece ser sobre conveniência - não sendo necessário desenvolver um novo teste cada vez que a situação muda; embora se a conveniência é a questão principal, já existe a capacidade de usar testes de permutação em qualquer estatística que gostamos. [Com a abordagem das pontuações normais, a dificuldade é que ainda precisamos de uma maneira adequada de classificar - você não pode apenas classificar coisas que não são comparáveis ​​sob o nulo e esperar o tipo certo de comportamento. Há um problema semelhante com o teste de permutação, pois você também precisa de permutabilidade sob o valor nulo.]

Você menciona uma função R, mas pode classificar e converter facilmente em notas normais em R apenas usando funções que já vêm com R.

por exemplo, usando os sleepdados em R., você faria um teste t desta maneira:

 t.test(extra ~ group, data = sleep)  # Welch
 t.test(extra ~ group, data = sleep, var.equal=TRUE)  # equal-variance
 t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep)  # normal scores

[1] Conover, WJ (1980),
Practical Nonparameteric Statistics , 2e.
Wiley. 316-327.

(A partir do link da Wikipedia acima, parece que em 3e (1999) a discussão começa na pg. 39)

[2] van der Waerden, BL (1952),
"Encomende testes para o problema de duas amostras e seu poder",
Anais da Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 55 ( Indagationes Mathematicae 14 ), 453-458.

[3] van der Waerden, BL (1953),
"Ensaios de pedidos para o problema de duas amostras. II, III",
Anais da Koninklijke Nederlandse Akademie van Wetenschappen , Série A 56 ( Indagationes Mathematicae , 15 ), 303-310 & 311-316.

(também há correções no artigo de 1952 na p. 80 desse volume)

[4] Fisher RA e Yates F. (1957)
Tabelas Estatísticas para Pesquisa Biológica, Agrícola e Médica , 5e, Oliver & Boyd, Edimburgo.

[5] Hodges, JL; Lehmann, EL (1961),
"Comparação dos Escores Normais e Testes de Wilcoxon",
Anais do Quarto Simpósio de Berkeley sobre Estatística Matemática e Probabilidade, Volume 1: Contribuições para a Teoria da Estatística , 307-317,
University of California Press, Berkeley, Califórnia.
Http://projecteuclid.org/euclid.bsmsp/1200512171 .

Glen_b -Reinstate Monica
fonte
Glen, este é um tópico interessante (sobre o qual gostaria de aprender mais) e uma boa resposta sua. Mas posso pedir que você adicione um pouco de carne (discurso / conclusões) a ela, além de apenas links? E, possivelmente, colete alguns links para perguntas e respostas semelhantes neste site? Obrigado.
ttnphns
Ótimo tópico. Existem comparações entre maçãs de uma abordagem não paramétrica e uma pontuação normal (com teste paramétrico) para testes de diferenças de médias? Meu colega e eu temos alguns para testes de correlações, mas é disso que eu sei. No contexto da correlação, as pontuações normais levam a um poder um pouco melhor que o teste de classificação (correlação de Spearman) ou o teste paramétrico não transformado (Pearson). Estou curioso para saber se resultados semelhantes ocorrem em outros contextos.
Anthony
1
@Antony. O item [5] apontado por Glen, contém uma comparação maçã a maçã dos escores normais e Wilcoxon com base na eficiência assintótica. O estudioso lista 114 citações para esse artigo, algumas delas devem fornecer outras formas de comparação.
Jacques Wainer
1
@Glen_b, para correlações, a vantagem dos escores normais foi mais proeminente quando as duas variáveis ​​eram extremamente fora do normal (por exemplo, ambas ~ ) e n era grande (> = 20, mas ainda maior mostrou vantagens maiores) ) Outro trabalho sugere que a assimetria e a curtose são importantes. Se estiver interessado, a referência pode ser encontrada aqui: stats.stackexchange.com/questions/131369/…χ2,df=1
Anthony
1
Desculpe por todos os comentários, mas não consigo segurar uma discussão tão divertida! Mais um pensamento - a figura de @ Glen_b aponta para um problema que foi chamado de "herança" por Zimmerman (2011). Mesmo após a transformação, as amostras separadas podem "herdar" algumas das propriedades da distribuição original não transformada. redalyc.org/articulo.oa?id=16917012005
Anthony