Os ecologistas são os únicos que não sabiam que o arco-seno é asinino?

8

Os dados de proporção, proporção e porcentagem são muito comuns na ecologia (por exemplo,% de flores polinizadas, razão de sexo masculino: feminino,% de mortalidade em resposta a um tratamento,% de folha consumida por um herbívoro). Um artigo foi publicado recentemente por alguns estatísticos aplicados na revista Ecology intitulada " O arcsine é asinina: a análise de proporções em ecologia ". Eles observaram que a transformação do arco-seno foi promovida por textos de longa duração, como a "Análise Bioestatística" de Zar e a "Biometria" de Sokal e Rohlf (ambos na 3ª ou 4ª edições), mas essa técnica foi ultrapassada por modelos lineares generalizados e melhor computação :

A transformação da raiz quadrada do arcsine é um procedimento padrão ao analisar dados proporcionais em ecologia, com aplicações em conjuntos de dados contendo variáveis ​​de resposta binomial e não binomial. Aqui, argumentamos que a transformação do arco-seno não deve ser usada em nenhuma circunstância. Para dados binomiais, a regressão logística tem maior interpretabilidade e maior poder do que análises de dados transformados. [...] Para dados não binomiais, a transformação do arco-seno é indesejável com base na interpretabilidade e porque pode produzir previsões sem sentido. A transformação do logit é proposta como uma abordagem alternativa para resolver esses problemas.

Eu queria saber o quão comum são os dados de proporção em outros campos (psicologia? Medicina?)? O arcsine ainda é comumente usado em outros campos ou os ecologistas são excepcionais no uso dessas (ou outras) técnicas ultrapassadas ou menos que as ideais? Houve trabalhos em outros campos que destacam a necessidade de usar técnicas mais avançadas?

N Brouwer
fonte

Respostas:

7

Ensino para estudantes de saúde pública por dois motivos:

  • um de meus colegas o ensina (no curso de introdução) como receita mágica, mostro o método Delta e como ele é derivado;

  • Penso que o método Delta e as transformações estabilizadoras de variância não são estúpidas e podem ser úteis. O intervalo de confiança calculado usando a transformação arcsin com correção da continuidade não é perfeito, mas comporta-se razoavelmente bem, e para amostras pequenas é muito melhor do que o procedimento Wald, que ainda é amplamente utilizado.

Como John de psicologia e neurociência, acho que muitas pessoas em epidemiologia nem se importam, elas apenas usam modelos lineares de maneira simples.

¹ Pires, Amado, 2008. Estimadores de intervalo para uma proporção binomial.

Elvis
fonte
1
Você sabe como isso se compara ao CI Agresti-Coull? (Agresti, A. e Coull, BA (1998). Aproximado é melhor do que “exato” para estimativa de intervalos de proporções binomiais. The American Statistician , 52 (2): 119–126.)
Alexis
5

Por experiência, posso dizer que a psicologia e a neurociência nem sempre fazem o esforço de transformar% values ​​para normalizá-los. A análise modal é uma ANOVA ou teste t do% correto ou% de erro.

John
fonte
5

A questão sobre a prevalência do uso da transformada arcsine na ecologia e em outros campos pode ser avaliada acessando o JStor, escolhendo alguns periódicos e pesquisando a palavra nas últimas duas décadas.

A discussão do tópico pode ser esclarecida, observando uma (dentre muitas) razões para não usar o arcsin. As proporções são baseadas no número de casos. Você daria o mesmo peso a uma proporção de 2 em 4 casos (não muito confiável) e a uma proporção mais confiável de 20 em 40 casos? A solução natural é usar o odds e odds ratio, e uma distribuição binomial para testar a mudança na proporção como uma mudança nas probabilidades, conforme descrito na publicação arcsin asinine. Dessa forma, você paga 50% de 40 em dívida, em comparação com 50% de 4.

David Schneider
fonte
2
+1 Bem-vindo ao nosso site! Se você realizou a pesquisa por palavra recomendada, que resultados você observou?
whuber
Para ser justo, geralmente é indicado que é apropriado apenas para (pelo menos aproximadamente) igual número de tentativas, a menos que você também pesa pelo valor recíproco do tamanho da amostra. E observe que os modelos mistos lineares generalizados geralmente não são abordados nos cursos de estatística da graduação, mesmo para os graus de Matemática / Estatísticas; portanto, é compreensível que a transformação do arco-seno esteja demorando muito para morrer.
Scortchi - Restabelece Monica
2
A variação assintótica é explícita no artigo vinculado pelo OP; portanto, a regressão ponderada é direta no caso em que os denominadores são conhecidos. (Se os denominadores são desconhecidas, regressão logística tem um problema, também.)
Glen_b -Reinstate Monica