Valores críticos de Wilcoxon-Mann-Whitney em R

Percebi que quando tento encontrar os valores críticos para o Mann-Whitney U usando R, os valores são sempre 1 + valor crítico. Por exemplo, para , o valor crítico (bicaudal) é 8, enquanto para , a (bicaudal) ) o valor crítico é 22 (verifique as tabelas ), mas: $\alpha=.05, n = 10, m = 5$ $\alpha=.05, n=12, m=8$

> qwilcox(.05/2,10,5)
[1] 9
> qwilcox(.05/2,12,8)
[1] 23

Claro que não estou pensando em algo, mas ... alguém poderia me explicar por quê?

r hypothesis-testing nonparametric wilcoxon-mann-whitney this.is.not.a.nick
fonte

Respostas:

Eu acho que a resposta aqui pode ser que você esteja comparando maçãs e laranjas.

Seja denotado o cdf da estatística Mann-Whitney . é a função quantil de . Por definição, é, portanto, $F(x)$ $U$ qwilcox $Q(\alpha)$ $U$

Q (α) = inf {x \in N : F (x) \geq α}, α \in (0, 1) .

$Q(\alpha)=\inf \{x\in \mathbb{N}: F(x)\geq \alpha\},\qquad \alpha\in(0,1).$

Como é discreto, geralmente não há tal que , então geralmente . $U$ $x$ $F(x)=\alpha$ $F(Q(\alpha))>\alpha$

Agora, considere o valor crítico para o teste. Neste caso, você quer , uma vez que de outra forma terá um teste com uma taxa de erro tipo I , que é maior do que a nominal. Isso geralmente é considerado indesejável; testes conservadores tendem a ser preferidos. Portanto, A menos que exista um tal que , temos, portanto, . $C(\alpha)$ $F(C(\alpha))\leq \alpha$

C (α) = sup {x \in N : F (x) \leq α}, α \in (0, 1) .

$C(\alpha)=\sup \{x\in \mathbb{N}: F(x)\leq \alpha\},\qquad \alpha\in(0,1).$

x

$x$

F (x) = α

$F(x)=\alpha$

C (α) = Q (α) - 1

$C(\alpha)=Q(\alpha)-1$

A razão da discrepância é que qwilcoxela foi projetada para calcular quantis e não valores críticos!

MånsT
fonte

(+1) Descrição boa, simples e concisa. :)

cardeal

Lembre-se de que a estatística do teste da soma da classificação é discreta e, portanto, é necessário usar um valor crítico para que a probabilidade da cauda seja para o especificado . Para algumas amostras, o tamanho de alfa não pode ser alcançado e esse é o meu palpite sobre o motivo pelo qual você precisa do +1. $\geq$ $\alpha$

Michael R. Chernick
fonte

Então, por que o +1 é necessário no R e não nas tabelas usuais?

MånsT

@ this.is.not.a.nick: talvez mais importante, enquanto , o que significa que, no primeiro caso, o nível de significância real será e que, neste último será . Geralmente, as pessoas tendem a preferir errar no lado direito, ou seja, a ter um nível de significância menor que o nominal (o que significa que os valores das tabelas são preferíveis).

0.0236723 < 0.025

$0.0236723<0.025$

0.02868937 > 0.025

$0.02868937>0.025$

< 0.05

$<0.05$

> 0.05

$>0.05$

MånsT

Direito ao Procrastinator e MansT. Na verdade, a definição do nível de significância requer que as probabilidades da cauda não sejam superiores a alfa. Eu falo sobre isso no meu artigo com Christine Liu sobre o comportamento serrilhado da função de potência para testes binomiais exatos através do método Clopper-Pearson (veja American Statistician (2002)).

22912 Michael Michael Chernick

@ Michael: Está na mesma página que esta. As tabelas seguem a definição padrão, o que significa que os valores críticos não são quantis.

MånsT

@ Michael: Concordo. Em certo sentido, qwilcoxfaz o que deveria fazer, mas não o que você esperaria que fizesse.

MånsT