Usando o método generalizado de momentos (GMM) para calcular o parâmetro de regressão logística

13

Desejo calcular coeficientes para uma regressão muito semelhante à regressão logística (na verdade, regressão logística com outro coeficiente: quandoApode ser dado). Pensei em usar o GMM para calcular os coeficientes, mas não tenho certeza de quais são as condições de momento que devo usar.

A1+e(b0+b1x1+b2x2+),
A

Alguém pode me ajudar com isso?

Obrigado!

user5497
fonte
Quando você diz " pode ser fornecido", você quer dizer que ele é especificado pelo usuário ou é estimado pelo modelo? UMA
Macro
de qualquer jeito. Eu pode colocá-lo como uma entrada (EGA = 0,25) ou ser um dos coeficientes de ser encontrado
user5497
Varia de assunto para assunto (isto é, dados) ou é uma constante fixa em todas as observações?
Macro
corrigido em todas as observações (como b0, b1, ...)
user5497
2
Por que não usar a máxima probabilidade em vez do GMM?
Macro

Respostas:

6

Assumindo , este modelo possui a variável de resposta de Bernoulli Y iUMA1YEu com

Pr(YEu=1)=UMA1+e-XEub,

onde (e possivelmente A , dependendo de ser tratado como uma constante ou um parâmetro) são os coeficientes ajustados e X i são os dados para observaçãobUMAXEuEu

As condições do momento são:

E[(YEu-UMA1+e-XEub)XEu]=0

Substituímos isso pela amostra da condição, assumindo que N observações:

m=1NEu=1N[(YEu-UMA1+e-XEub)XEu]=0 0

mmb (abaixo, usaremos o Nelder-Mead simplex para executar essa otimização).

UMA é constante e igual a 1 neste caso:

dat <- as.matrix(cbind(data.frame(IsVersicolor = as.numeric(iris$Species == "versicolor"), Intercept=1), iris[,1:4]))
head(dat)
#      IsVersicolor Intercept Sepal.Length Sepal.Width Petal.Length Petal.Width
# [1,]            0         1          5.1         3.5          1.4         0.2
# [2,]            0         1          4.9         3.0          1.4         0.2
# [3,]            0         1          4.7         3.2          1.3         0.2
# [4,]            0         1          4.6         3.1          1.5         0.2
# [5,]            0         1          5.0         3.6          1.4         0.2
# [6,]            0         1          5.4         3.9          1.7         0.4

Aqui estão os coeficientes ajustados usando regressão logística:

summary(glm(IsVersicolor~., data=as.data.frame(dat[,-2]), family="binomial"))
# Coefficients:
#              Estimate Std. Error z value Pr(>|z|)    
# (Intercept)    7.3785     2.4993   2.952 0.003155 ** 
# Sepal.Length  -0.2454     0.6496  -0.378 0.705634    
# Sepal.Width   -2.7966     0.7835  -3.569 0.000358 ***
# Petal.Length   1.3136     0.6838   1.921 0.054713 .  
# Petal.Width   -2.7783     1.1731  -2.368 0.017868 *  

(YEu-UMA1+e-XEub)XEuEu

moments <- function(b, X) {
  A <- 1
  as.vector(X[,1] - A / (1 + exp(-(X[,-1] %*% cbind(b))))) * X[,-1]
}

b

init.coef <- lm(IsVersicolor~., data=as.data.frame(dat[,-2]))$coefficients
library(gmm)
fitted <- gmm(moments, x = dat, t0 = init.coef, type = "iterative", crit = 1e-19,
              wmatrix = "optimal", method = "Nelder-Mead",
              control = list(reltol = 1e-19, maxit = 20000))
fitted
#  (Intercept)  Sepal.Length   Sepal.Width  Petal.Length   Petal.Width  
#      7.37849      -0.24536      -2.79657       1.31364      -2.77834  
# 
# Convergence code =  0 

O código de convergência 0 indica o procedimento convergido e os parâmetros são idênticos aos retornados por regressão logística.

momentEstim.baseGmm.iterativegmm:::.obj1mmoptimgmm

gmm.objective <- function(theta, x, momentFun) {
  avg.moment <- colMeans(momentFun(theta, x))
  sum(avg.moment^2)
}
optim(init.coef, gmm.objective, x=dat, momentFun=moments,
      control = list(reltol = 1e-19, maxit = 20000))$par
#  (Intercept) Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
#    7.3784866   -0.2453567   -2.7965681    1.3136433   -2.7783439 
josliber
fonte