Quais propriedades úteis a função de link canônico possui?

Respostas:

8

Eu sei que essa pergunta é bastante ingênua e simples, mas não sei exatamente por que a função canônica do link é tão útil

É realmente tão útil? Uma função de link sendo canônica é principalmente uma propriedade matemática. Isso simplifica um pouco a matemática, mas na modelagem você deve usar a função de link que é cientificamente significativa.

Então, quais propriedades extras uma função de link canônico possui?

  1. Isso leva à existência de estatísticas suficientes. Talvez isso implique uma estimativa um pouco mais eficiente, mas o software moderno (como glmno R) parece não tratar os links canônicos de maneira diferente dos outros links.

  2. Ele simplifica algumas fórmulas, facilitando o desenvolvimento teórico. Muitas boas propriedades matemáticas, consulte Qual é a diferença entre uma "função de link" e uma "função de link canônico" para GLM .

Portanto, as vantagens parecem ser principalmente matemáticas e algorítmicas, não realmente estatísticas.

Mais alguns detalhes: Seja Y1,...,Yn observações independentes do modelo da família de dispersão exponencial

fY(y;θ,ϕ)=exp{(yθ-b(θ))/uma(ϕ)+c(y,ϕ)}
com expectativa EYEu=μEu preditor linearηEu=xEuTβ com vetor covariadoxEu . A função de link é canônica seηEu=θEu . Neste caso, a função de probabilidade pode ser expressa como
L(β;ϕ)=exp{iyixiTβb(xiTβ)a(ϕ)+ic(yi,ϕ)}
e peloteoremadafatoraçãopodemos concluir queixEuyEué suficiente paraβ.

Sem entrar em detalhes, as equações necessárias para o IRLS serão simplificadas. Da mesma forma, essa pesquisa no Google parece principalmente encontrar links canônicos mencionados no contexto de simplificações, e não mais razões estatísticas.

kjetil b halvorsen
fonte
É matematicamente útil, talvez.
AdamO 23/05/19
Sim, é o que eu tentei dizer!
Kjetil b halvorsen
7

A função de link canônico descreve a relação de variação média em um GLM. Por exemplo, uma variável aleatória binomial tem a função de link μ=exp(ν)/(1exp(ν)) onde ν é um preditor linear XTβ . Observe que νμ=μ(1μ)que é a relação de variação média apropriada para uma variável aleatória de Bernoulli. O mesmo se aplica às variáveis ​​aleatórias de Poisson, em que a função de link inverso éμ=exp(ν)eνμ=μonde, em uma variável aleatória de Poisson, a variação é a média.

O modelo linear generalizado resolve uma equação de estimativa da forma:

S(β)=DV1(Yg(XTβ))

D=βg(XTβ)V=var(Y)D=V

S(β)=XT(Yg(XTβ))

Como foi observado no artigo de Wedderburn, de 1976, sobre a quase-probabilidade, o link canônico tem a vantagem de que as informações esperadas e observadas são as mesmas e que os mínimos quadrados com ponderação iterativa são equivalentes a Newton-Raphson, portanto, isso simplifica os procedimentos de estimativa e a estimativa de variância.

AdamO
fonte