Por que o glm () fornece estimativas e erros padrão na escala do link?

7

Em R, os parâmetros estimados por glm()e seus erros padrão são fornecidos na escala de links, como alguém recentemente me esclareceu aqui . Faz sentido fornecer os parâmetros e seus erros padrão na mesma escala, mas por que não exibi-los na escala original dos dados? Eu imagino que a maioria das pessoas esteja interessada nas estimativas na escala original e as transforme de volta na maior parte do tempo. Embora os comentários a esta pergunta abordem a questão de como transformar as estimativas de parâmetros e seus erros padrão, ainda estou curioso sobre o motivo pelo qual essas estimativas são fornecidas pela função summary()na escala do link e não na escala original.

Marco Plebani
fonte

Respostas:

13

Difícil saber com certeza, mas existem algumas razões pelas quais a escala de links é útil.

  • O uso de erros padrão como um resumo da incerteza geralmente é mais confiável na escala do link, onde o domínio dos parâmetros é ilimitado e onde a suposição de que a superfície da probabilidade é aproximadamente quadrática (a distribuição de amostragem das estimativas de parâmetros é aproximadamente Normal) é mais provável que seja razoável. Por exemplo, suponha que você tenha um modelo de link de log com estimativa (na escala de link) 1.0 e erro padrão 3.0. Na escala do link, o intervalo de confiança é de aproximadamente . Se você voltar a transformar, exponenciando o parâmetro e multiplicando o erro padrão pelo parâmetro exponenciado (como nesta resposta ) e, em seguida, tentar construir ICs simétricos, obterá1±1.96×32.718±1.96×3×2.718 , que inclui valores negativos ... se você deseja transformar em retrocesso, faz mais sentido retroceder os intervalos de confiança , ou seja, .exp(1±1.96×3)
  • Provavelmente, o mais importante é que, para o link de logit muito comum, é basicamente impossível transformar os parâmetros de maneira sensata até a escala de dados (ou seja, de logit / log-odds ratio para probabilidade). É comum exponenciar parâmetros para passar da escala log-odds ratio para a escala odds-ratio, mas você não pode voltar de odds ratio para probabilidades sem especificar um valor de linha de base. Ou seja, você pode dizer em geral "o odds ratio associado ao controle versus tratamento é XXX", mas a mudança na probabilidade de controle para tratamento dependerá de outras covariáveis ​​(por exemplo, o odds ratio para mulheres e homens pode ser o mesmo enquanto a mudança na probabilidade é diferente porque o risco da linha de base é diferente para mulheres e homens).

Provavelmente, a razão proximal é que, devido aos problemas listados acima, a maioria das pessoas que faz muita modelagem estatística se acostumou a interpretar parâmetros na escala de links; a maioria dos epidemiologistas e bioestatísticos tem que gastar tempo aprendendo sobre odds ratio e log-odds ratio, e há muitos artigos escritos sobre sua interpretação. Para melhor ou para pior, R foi escrito por pessoas que se sentem confortáveis ​​em interpretar parâmetros na escala de links. Muitos pacotes downstream, como o vassoura, têm opções que exponenciam parâmetros e ICs para você (colocando-os na escala de dados (contagem) para o link de log; a escala de razão de chances para links de logit; e a escala de taxa de risco para links de cloglog) .

Ben Bolker
fonte
Muito Obrigado. Vou precisar de algum tempo para entender seu segundo ponto (não por falta de clareza do seu lado). Com relação ao seu primeiro ponto, ele soa como um ex-colega meu, uma vez me explicou o uso da expansão de Taylor para estudar a propagação de erros. Por que a expansão de Taylor falha em fornecer os erros padrão reais? É porque é um método geral que não possui premissas específicas da situação (nesse caso, a SE deve produzir IC positivo no caso de dados de contagem)?
Marco Plebani
2
A expansão de Taylor gera erros padrão razoáveis ​​(embora [eu acho]] não sejam exatos se a distribuição da amostra tiver momentos mais altos que zero), mas o principal problema não está nos erros padrão, mas na tradução de erros padrão para CIs
Ben Bolker
Obrigado. Ainda não está claro para mim por que a expansão de Taylor produziria estimativas razoáveis ​​de SE, mas elas poderiam se traduzir em estimativas irracionais do IC. Além disso, testei diferentes métodos para obter estimativas de erro padrão, e isso abriu uma nova lata de vermes. Criei uma pergunta ad hoc: stats.stackexchange.com/questions/355431/… - Cheers
Marco Plebani
2
Considere uma distribuição extremamente distorcida (digamos, uma distribuição exponencial). A média teórica e o desvio padrão são idênticos (por exemplo, consulte a Wikipedia . Portanto, o limite inferior do intervalo de confiança de 95% de Wald (ou seja, aquele baseado no desvio padrão / suposição de normalidade) é sempre negativo.
Ben Bolker