Exibindo dados ordinais - médias, medianas e classificações médias

11

Como tenho alguns dados ordinais que normalmente não são distribuídos, decidi fazer testes não paramétricos usando o Teste U de Mann-Whitney. Estou observando as diferenças entre os grupos para sete pontuações - essas pontuações são 0, 1, 2 ou 3 para cada sujeito. Estou com dificuldades para descobrir como exibir meus dados!

Se eu apresentar os dados usando as medianas (e o IQR das medianas), não está claro onde estão as diferenças, porque na maioria das vezes as medianas caem em 0 ou 1. Portanto, apesar do teste U de Mann-Whitney mostrar diferenças significativas, a mesa parece desinteressante.

Eu também poderia apresentar os dados usando os meios . Existem alguns artigos científicos por aí que dizem que você pode usar meios com dados ordinais, mas que não pode fazer o mesmo tipo de suposições sobre diferenças entre as pontuações (por exemplo, a diferença entre 0 e 1 não é a mesma que entre 1 e 2) Usar meios seria um pouco controverso, embora os números na tabela contem bem a história quando os uso.

Uma terceira opção é usar as classificações médias que o SPSS me fornece na saída do Mann-Whitney. As classificações médias são o que estão sendo comparadas entre os grupos, então talvez eu deva apenas usá-las? O único problema que tenho com isso é que as classificações médias realmente não significam nada em relação aos dados reais (por exemplo, eu não consigo ver que os sujeitos estão mais próximos de um 3, enquanto os controles estão mais próximos de um 1 usando as classificações médias).

E uma última opção foi realizar uma análise do qui-quadrado comparando sujeitos e controles após dividir as pontuações em dois grupos (0 e 1 para baixo e 2 e 3 para alto). No entanto, quando fiz isso, as diferenças não foram tão pronunciadas (provavelmente por várias razões).

Eric
fonte
Você está perguntando sobre a melhor forma de apresentar seus dados em texto, em uma tabela ou em uma figura?
gung - Restabelece Monica
Texto e tabela. No texto, vou dizer que houve diferenças significativas entre os grupos em vários componentes da minha pesquisa sobre sono. Essas diferenças são feitas através do teste de Mann-Whitney, portanto, eles estão comparando as classificações médias. O que não sei é como devo apresentar essas diferenças em uma tabela. O uso de medianas não funciona porque são muito semelhantes e você não pode ver as diferenças. Os meios funcionam melhor, mas parece estranho usar medidas paramétricas em uma tabela que deve ser sobre as medianas não paramétricas. E as classificações médias funcionariam, mas não representam valores reais.
Eric
1
Gostaria de saber se algumas respostas do Graph para relacionamento entre duas variáveis ​​ordinais poderiam ser adaptadas para seus propósitos. Os gráficos de exemplo mostram o relacionamento entre duas variáveis, cada uma com cinco níveis, mas se você estiver comparando dois grupos e tiver quatro níveis possíveis, poderá repensar algumas dessas visualizações como 4 por 2 em vez de 5 por 5, talvez.
Silverfish
Pode ser útil se você puder postar alguns dados de exemplo (possivelmente totalmente falsos), para que as pessoas que desejam demonstrar uma possível técnica tenham algo com o que trabalhar.
Silverfish
1
Eric, por definição, um teste não paramétrico, Mann-Whitney em particular, compara (pelo domínio) duas distribuições geralmente, não compara um valor de parâmetro específico de uma distribuição, como média ou mediana. Não existe um número único que seja uma característica de uma distribuição e, ao mesmo tempo, seja o que está sendo comparado, neste caso. Você pode usar o estimador de duas amostras Hodges-Lehmann, mas é a característica da diferença entre duas distribuições e não de cada uma das duas distribuições.
ttnphns

Respostas:

8

1,2,=3

A correção de usar a média para resumir variáveis ​​ordinais raramente pode vir dos próprios dados. É subjetivo.

Dxyγxy

Frank Harrell
fonte
1
Oi Frank, obrigado por sua resposta atenciosa. Se você não se importa, tenho algumas perguntas de acompanhamento. Com relação aos meios - acredito que as categorias são pelo menos parcialmente significativas, pois se referem basicamente a "comprometimento não, leve, moderado e grave", respectivamente. Você conhece alguma referência que eu possa usar como precedente? Também hesito em usar meios em apenas uma tabela e medianas em outras por uma questão de consistência. E para os médios - acredito que estou comparando grupos - sujeitos x controles em 7 pontos. A comparação de classificações médias é aceitável / útil?
Eric
Para dados ordinais numéricos com poucos níveis, como contagens e talvez seu exemplo de deficiência, os meios são úteis e as medianas não (por causa de muitos vínculos). Há muitas ocasiões em que usei meios para dados ordinais e medianas para dados contínuos distorcidos, na mesma tabela.
26716 Frank Harrell