Escala variável como dados de contagem - correto ou não?

10

No presente trabalho (disponível gratuitamente via PubMed Central), os autores usam regressão binomial negativa para modelar a pontuação em um instrumento de triagem de 10 itens marcou 0-40. Este procedimento assume dados de contagem, o que claramente não é o caso aqui. Gostaria de suas opiniões sobre se essa abordagem é aceitável, porque às vezes uso o mesmo instrumento ou similares em meu trabalho. Caso contrário, gostaria de saber se existem alternativas aceitáveis. Mais detalhes abaixo:

A escala utilizada é o Teste de Identificação de Transtornos por Uso de Álcool (AUDIT), um questionário de 10 itens desenvolvido como um instrumento de triagem para transtorno por uso de álcool e bebida perigosa / prejudicial. O instrumento é pontuado de 0 a 40, e os resultados são tipicamente inclinados para a esquerda.

No meu entender, o uso de dados de contagem pressupõe que todos os valores "contados" são independentes um do outro - pacientes que chegam a um pronto-socorro todos os dias, número de mortes em um determinado grupo etc. - são todos independentes um do outro, embora dependente de variáveis ​​subjacentes. Além disso, acho que não pode haver uma contagem máxima permitida ao usar dados de contagem, apesar de achar que essa suposição pode ser relaxada quando o máximo teórico é muito alto quando comparado ao máximo observado nos dados?

Ao usar a escala AUDIT, não temos uma contagem verdadeira. Temos 10 itens com uma pontuação total máxima de 40, embora essas pontuações altas raramente sejam vistas na prática. As pontuações nos itens são naturalmente correlacionadas entre si.

As suposições necessárias para usar os dados da contagem são, portanto, violadas. Mas isso ainda é uma abordagem aceitável? Quão sérias são as violações das suposições? Existem certas circunstâncias sob as quais essa abordagem pode ser considerada mais aceitável? Existem alternativas para essa abordagem que não envolvam a redução da variável de escala em categorias?

JonB
fonte

Respostas:

4

O instrumento AUDIT é essencialmente uma escala Likert. Um conjunto de perguntas (itens do Likert), com respostas geralmente em uma escala de cinco pontos, é projetado para chegar a algum fenômeno subjacente. A soma das respostas ao conjunto de perguntas, a escala Likert, é então usada como a medida do fenômeno subjacente. Embora os itens do tipo Likert são muitas vezes em uma escala de "discordo totalmente" a "concordo totalmente", o aplicativo para medir uma tendência para " A lcohol U se D isorders" neste " I DENTIFICAÇÃO T est" é simples.

Conforme observado na página da Wikipedia na escala Likert , "Se itens individuais do Likert podem ser considerados dados em nível de intervalo ou se devem ser tratados como dados categóricos ordenados são objeto de considerável desacordo na literatura, com fortes convicções sobre o que são os métodos mais aplicáveis ​​". Essa disputa provavelmente remonta à maior parte dos 80 anos ou mais desde que Likert propôs pela primeira vez a escala: cada etapa da escala é equivalente, tanto dentro quanto entre os itens que compõem a escala? O problema foi abordado no Cross Validated, como nas respostas a esta pergunta , uma das primeiras perguntas feitas neste site.

Se você aceitar a ideia de que a balança possui etapas uniformes (ou próximas o suficiente para uniformizar a aplicação em questão, talvez com média de adição de 10 itens diferentes, como em AUDITORIA), várias abordagens de análise são possíveis. Uma é considerar a resposta na escala como uma série de etapas escolhidas ou não para subir na escala, com a mesma probabilidade de subir cada uma das etapas.

Isso permite pensar em " dados da escala Likert de n pontos como n tentativas de um processo binomial ", como em uma pergunta de 2010 de @MikeLawrence. Embora as respostas a essa pergunta não tenham sido terrivelmente favoráveis ​​a essa ideia, não foi difícil encontrar rapidamente hoje um estudo de 2014 que usou e estendeu essa abordagem com êxito para distinguir subpopulações com diferentes probabilidades binomiais. Embora um processo binomial seja freqüentemente usado para modelar dados de contagem, ele pode ser usado para modelar o número, a contagem, de etapas que um indivíduo executou na escala de "Distúrbios do uso de álcool".

Como o @Scortchi observou em uma resposta à pergunta vinculada no segundo parágrafo, uma limitação do modelo binomial é que ele impõe uma relação específica entre a média e a variação da resposta. O binômio negativo remove essa restrição, com a perda da fácil interpretação fornecida pelo modelo binomial simples. Na análise, o parâmetro extra que precisa ser ajustado consome apenas um grau adicional de liberdade. Por outro lado, tentar especificar probabilidades diferentes para cada uma das 40 etapas do item Likert e sua soma na escala Likert seria assustadora.

Como observou @MatthewGraves em sua resposta a esta pergunta, se o modelo binomial negativo é apropriado, é melhor responder examinando os resíduos. No estudo original que desenvolveu o AUDIT, um valor de 8 ou mais na escala de 40 pontos apresentava especificidade e sensibilidade bastante razoáveis ​​para distinguir aqueles diagnosticados com "uso perigoso ou perigoso de álcool" em 6 países diferentes. Portanto, talvez um modelo binomial de duas populações baseado em populações de alto e baixo risco, semelhante ao estudo de 2014 acima, seria melhor.

Os interessados ​​em AUDIT especificamente devem examinar esse estudo original. Por exemplo, embora a necessidade de uma bebida matinal pareça medir algo completamente diferente da frequência do consumo, como supôs o @SeanEaster, o consumo matinal tem uma correlação média ponderada de 0,73 com uma escala de medidas da ingestão de álcool. (Esse resultado não é surpreendente para alguém que teve amigos com transtornos relacionados ao uso de álcool.) AUDIT parece ser um bom exemplo das compensações necessárias para desenvolver um instrumento que possa ser usado de maneira confiável em várias culturas.

EdM
fonte
Obrigado por uma boa resposta. Ao olhar para meus próprios dados de AUDIT de mais de 20.000 indivíduos, a forma parece próxima a uma distribuição binomial negativa; portanto, pode ser razoável usar essa suposição distributiva, ou talvez um modelo de quase-poisson possa ser usado? Se usarmos uma distribuição binomial considerando os pontos como k sucessos em 40 tentativas de bernoulli, não teremos um problema sério de super-dispersão? Parece assim nos meus dados. O quase-binomial poderia ser uma alternativa?
19415 JonB
Depende muito do motivo pelo qual você está modelando as pontuações 0-40 AUDIT e que interpretação heurística você deseja colocar nos resultados. Se tudo o que você deseja é uma relação das pontuações AUDIT com outras variáveis, com apenas uma interpretação limitada dos próprios valores dos parâmetros de distribuição, use uma distribuição que forneça resíduos bem comportados; suas sugestões são razoáveis. Ajustar um único binômio aos dados é problemático, mas uma mistura de 2 binômios (grupos de alto e baixo risco) com p diferentes pode ser informativa. Use seu julgamento com base no seu conhecimento do assunto.
Edm
2

x=40.x40.

Como comentário geral, diferentes sabores de regressão têm diferentes antecedentes para parâmetros (isto é, regularização) e diferentes modelos de ruído. A regressão de mínimos quadrados padrão tem um modelo de ruído gaussiano, a regressão binomial negativa tem um modelo de ruído binomial negativo e assim por diante. O verdadeiro teste para determinar se um modelo de regressão é apropriado ou não é se o ruído residual tem ou não a distribuição esperada.

Portanto, você pode aplicar regressão binomial negativa aos seus dados, calcular os resíduos e, em seguida, plotá-los em um gráfico de probabilidade binomial negativa e ter uma idéia de se o modelo é ou não apropriado. Se o ruído for estruturado de alguma outra maneira, precisamos procurar um modelo de ruído que se encaixe mais nessa estrutura.

Raciocinar do modelo generativo para a estrutura de ruído é útil - se soubermos que os dados são multiplicativos em vez de aditivos, por exemplo, alcançaremos o lognormal em vez do normal - mas se o modelo generativo esperado e a estrutura de ruído discordarem, vá com os dados, não com a expectativa.

Matthew Graves
fonte
Interessante, eu não sabia que os eventos poderiam ser "contagiosos". O que você quer dizer com substituir x = 40 por x> = 40, na prática? Como eu faço um gráfico de probabilidade binomial negativa em R? Suponho que você não quis dizer resíduos de plotagem contra valores ajustados? Você quer dizer como um enredo de QQ?
21915 JonB
@ JonB Suponha que você tenha um binômio negativo com r = 1 e probabilidade de sucesso p = 0,9. A probabilidade de sobreviver a 40 tentativas é exatamente 0,148%; a probabilidade de sobreviver a 40 ou mais tentativas é de 1,48%. Assim, pode-se definir uma probabilidade bem formada no domínio [0,40] usando o binômio negativo para [0,39] e, em seguida, definindo [40] para que some um, o que é porque a distribuição binomial negativa é bem-sucedida. formada é a probabilidade de 40 ou mais.
Matthew Graves
@ JonB Exatamente, quero dizer como um enredo de QQ. Eu não fiz isso no R antes, mas espero que este link ajude.
Matthew Graves
11
Fiz um experimento com alguns dados com as pontuações do AUDIT. Ao criar um gráfico qq, preciso criar um vetor aleatório de resultados a partir de uma distribuição binomial negativa. O mu / theta é dado pelo meu modelo de regressão, mas como posso saber qual "tamanho" usar? Sinto muito se esta é uma pergunta específica de R .. De qualquer forma, você tem uma boa referência sobre a qual eu posso ler mais sobre a aplicação de binômio negativo (e outras distribuições) a esses tipos de escalas construídas pela soma de vários itens que medem o tipo do mesmo processo?
21915 JonB,
Eu fiz algumas experiências adicionais agora. Simulei um conjunto de dados com duas variáveis: x e y. 50% são x = 0, 50% são x = 1. Aqueles que são x = 0 têm uma probabilidade de 0,2 para y = 1, e aqueles que são x = 1 têm uma probabilidade de 0,4 para y = 1. Fiz então uma regressão logística e observei os resíduos. Eles não parecem distribuídos binomialmente. De fato, eles (é claro) assumem 4 valores específicos. Você tem certeza de que o padrão residual deve sempre corresponder à suposição distributiva? Porque, neste caso, está claramente errado.
21416 JonB,