Família binomial R com link de identidade

8

Eu quero ajustar um modelo linear por R com family=binomial(link="identity"), no entanto, a família binomial não tem vínculo de identidade. O que devo fazer?

david
fonte
Eu acho que há uma questão estatística subjacente aqui.
Glen_b -Reinstala Monica
Sim, a seguinte pergunta perguntará sobre Ajustar o erro padrão para superdispersão.
David #
Mas para o primeiro, preciso usar o link de identidade na família binomial, mas R não permite.
david
1
Observe que, se você precisar lidar com superdispersão e usar um link de identidade, considere ir diretamente para um modelo quase com função de variação binomial. Um modelo binomial somente de interceptação pode ser montado manualmente .
Glen_b -Reinstala Monica
2
(E se você queria que o parâmetro de dispersão fixado em um: family=binomial(link=make.link("identity")).
Scortchi - Reintegrar Monica

Respostas:

9

Consulte a Wikipedia sobre o modelo de probabilidade linear , e as postagens de CV aqui e aqui para obter o histórico estatístico. Embora não seja "errado", você deseja um bom motivo para usar um link de identidade para modelar uma probabilidade de Bernoulli.

De acordo com o familymanual

a família binómio [aceita] as ligações logit, probit, cauchit, (que corresponde a logística, normal e de Cauchy CDFs, respectivamente) log e cloglog(log-log complementar)

Mas

Os argumentos de link e variação têm semânticas bastante estranhas para compatibilidade retroativa. A maneira recomendada é fornecê-los como cadeias de caracteres entre aspas, mas elas também podem ser fornecidas sem aspas (como nomes ou expressões). Além disso, eles também podem ser fornecidos como um vetor de tamanho um caractere, fornecendo o nome de uma das opções ou como uma lista (para link, de classe "link-glm"). As restrições se aplicam apenas aos links dados como nomes: quando dados como uma sequência de caracteres, todos os links conhecidos make.linksão aceitos.

Então family=binomial(link="identity")funciona, mas family=binomial(link=identity)não funciona . (Se você achar que pode ser diferente da versão R.) Para permitir a dispersão excessiva, use family=quasi(link="identity", variance = "mu(1-mu)").

Scortchi - Restabelecer Monica
fonte
a correção link = "identidade" vs. link = identidade foi uma grande ajuda. Este é um exercício no livro CDA da Agresti. O código que ele fornece é o quase (link ...) que você discute, no entanto, a simplicidade de adicionar "" é uma correção elegante. Para meu entendimento, a ligação link = "identity" representa o binômio como um modelo linear.
23715 Justin