Então, aqui estou estudando modelos lineares generalizados. Sei que essa pergunta é bastante ingênua e simples, mas não sei exatamente por que a função canônica do link é tão útil. Alguém poderia me fornecer uma intuição sobre esse problema?
Então, aqui estou estudando modelos lineares generalizados. Sei que essa pergunta é bastante ingênua e simples, mas não sei exatamente por que a função canônica do link é tão útil. Alguém poderia me fornecer uma intuição sobre esse problema?
Eu sei que essa pergunta é bastante ingênua e simples, mas não sei exatamente por que a função canônica do link é tão útil
É realmente tão útil? Uma função de link sendo canônica é principalmente uma propriedade matemática. Isso simplifica um pouco a matemática, mas na modelagem você deve usar a função de link que é cientificamente significativa.
Então, quais propriedades extras uma função de link canônico possui?
Isso leva à existência de estatísticas suficientes. Talvez isso implique uma estimativa um pouco mais eficiente, mas o software moderno (como glm
no R) parece não tratar os links canônicos de maneira diferente dos outros links.
Ele simplifica algumas fórmulas, facilitando o desenvolvimento teórico. Muitas boas propriedades matemáticas, consulte Qual é a diferença entre uma "função de link" e uma "função de link canônico" para GLM .
Portanto, as vantagens parecem ser principalmente matemáticas e algorítmicas, não realmente estatísticas.
Mais alguns detalhes: Seja observações independentes do modelo da família de dispersão exponencial
Sem entrar em detalhes, as equações necessárias para o IRLS serão simplificadas. Da mesma forma, essa pesquisa no Google parece principalmente encontrar links canônicos mencionados no contexto de simplificações, e não mais razões estatísticas.
A função de link canônico descreve a relação de variação média em um GLM. Por exemplo, uma variável aleatória binomial tem a função de linkμ=exp(ν)/(1−exp(ν)) onde ν é um preditor linear XTβ . Observe que ∂∂νμ=μ(1−μ) que é a relação de variação média apropriada para uma variável aleatória de Bernoulli. O mesmo se aplica às variáveis aleatórias de Poisson, em que a função de link inverso éμ=exp(ν) e∂∂νμ=μ onde, em uma variável aleatória de Poisson, a variação é a média.
O modelo linear generalizado resolve uma equação de estimativa da forma:
Como foi observado no artigo de Wedderburn, de 1976, sobre a quase-probabilidade, o link canônico tem a vantagem de que as informações esperadas e observadas são as mesmas e que os mínimos quadrados com ponderação iterativa são equivalentes a Newton-Raphson, portanto, isso simplifica os procedimentos de estimativa e a estimativa de variância.
fonte