O que é teta em uma regressão binomial negativa ajustada com R?

26

Eu tenho uma pergunta sobre uma regressão binomial negativa: Suponha que você tenha os seguintes comandos:

require(MASS)
attach(cars)
mod.NB<-glm.nb(dist~speed)
summary(mod.NB)
detach(cars)

(Observe que carros é um conjunto de dados disponível em R e eu realmente não me importo se esse modelo faz sentido.)

O que eu gostaria de saber é: como interpretar a variável theta(conforme retornado na parte inferior de uma chamada para summary). Esse é o parâmetro de forma da distribuição do negbin e é possível interpretá-lo como uma medida de assimetria?

MarkDollar
fonte
Um resumo do que o MASS diz está aqui .
Scortchi - Restabelecer Monica

Respostas:

17

Sim, thetaé o parâmetro de forma da distribuição binomial negativa e não, você não pode realmente interpretá-lo como uma medida de assimetria. Mais precisamente:

  • assimetria dependerá do valor de theta, mas também da média
  • não existe valor thetaque garanta a falta de inclinação

Se eu não errei, na mu/ thetaparametrização usada na regressão binomial negativa, a assimetria é

Skew(NB)=θ+2μθμ(θ+μ)=1+2μθμ(1+μθ)

Nesse contexto, é geralmente interpretado como uma medida de super-dispersão em relação à distribuição de Poisson. A variação do binômio negativo é μ + μ 2 / θ , então θ realmente controla a variabilidade excessiva em comparação com Poisson (que seria μ ), e não a inclinação.θμ+μ2/θθμ

Aniko
fonte
obrigado até agora! Isso é uma boa ajuda ... Mas: Como posso interpretar valores altos ou (baixos) de teta? No livro de McCaullaughs, modelos lineares generalizados, existe um link para este artigo de anscombe para fazer uma interpretação de k. Mas, infelizmente, eu realmente não entendo. O artigo é claremontmckenna.edu/facultysites/math/FacMember/MOneill/…
MarkDollar
Você só precisa ler a primeira página. Então teta (ou k em anscombe) é o parâmetro de forma da distribuição negbin e gerencia, se a distribuição estiver mais próxima de gama (k -> 0) ou poisson (k -> infinito). Mas o que isso significa para o ajuste? Como posso interpretar teta, por exemplo, para a estimativa de carros?
MarkDollar
33

Fui indicado para este site por um dos meus alunos no meu curso Modeling Count Data . Parece haver muita desinformação sobre o modelo binomial negativo, e especialmente no que diz respeito à estatística de dispersão e ao parâmetro de dispersão.

A estatística de dispersão, que fornece uma indicação de extra-dispersão do modelo de contagem, é a estatística de Pearson dividida pelo DOF residual. μglmglm.nb θ

glm.nbglm vez deμ+μ2θμ+αμ2glm.nbglmglm.nbaparentemente pegou o relacionamento indireto de McCullagh & Nelder, mas Nelder (que foi o co-fundador da GLM em 1972) escreveu seu complemento de sistema kk para Genstat em 1993, no qual ele argumentava que o relacionamento direto é preferido. Ele e sua esposa costumavam visitar eu e minha família a cada dois anos no Arizona, começando no início de 1993 até o ano anterior à sua morte. Discutimos isso muito bem, pois eu tinha colocado um relacionamento direto no programa glm que escrevi no final de 1992 para os softwares Stata e Xplore e para uma macro SAS em 1994.

nbinomialαθnbinomial

Joseph Hilbe
fonte
2
ϕcov(β^)=ϕ(XTŴ^X)1θμθ"forma" - a última das quais não acho razoável, pois certamente influencia a forma.
Momo
Qual é o alcance do teta? Teta deve ser um valor maior que um?
News_is_Selection_Bias 25/11
2

binômio negativo de referência glm: insira a descrição da imagem aqui

O binômio negativo da Wikipedia 'r' é o 'theta' da glm, o que implica que o glm 'theta' é o parâmetro de forma. Em termos simples, o 'theta' da glm é o número de falhas.

datageek
fonte