Qual é a diferença entre o modelo Logit e Probit ? Estou mais interessado aqui em saber quando usar a regressão logística e quando usar o Probit. Se houver alguma literatura que o defina usando R , isso também seria
Uma generalização da regressão linear que permite relacionamentos não lineares por meio de uma "função de link" e a variação da resposta depende do valor previsto. (Não deve ser confundido com o "modelo linear geral", que estende o modelo linear comum à estrutura geral de covariância e resposta multivariada.)
Qual é a diferença entre o modelo Logit e Probit ? Estou mais interessado aqui em saber quando usar a regressão logística e quando usar o Probit. Se houver alguma literatura que o defina usando R , isso também seria
Quais gráficos de diagnóstico (e talvez testes formais) você considera mais informativos para regressões em que o resultado é uma variável de contagem? Estou especialmente interessado em Poisson e nos modelos binomiais negativos, bem como nos modelos com inflado zero e obstáculos de cada um. A...
A distribuição gama pode assumir uma ampla variedade de formas e, dado o vínculo entre a média e a variação através de seus dois parâmetros, parece adequado para lidar com a heterocedasticidade em dados não negativos, de uma maneira que o OLS transformado em log pode sem o WLS ou algum tipo de...
Estou começando a se envolver com o uso de glmnetcom LASSO Regressão onde meu desfecho de interesse é dicotômica. Criei um pequeno quadro de dados simulado abaixo: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67,...
Eu tenho um conjunto de dados com cerca de 30 variáveis independentes e gostaria de construir um modelo linear generalizado (GLM) para explorar o relacionamento entre elas e a variável dependente. Estou ciente de que o método que me foi ensinado para essa situação, a regressão gradual, agora é...
Qual é a diferença entre os termos 'função de link' e 'função de link canônico'? Além disso, existem vantagens (teóricas) em usar uma sobre a outra? Por exemplo, uma variável de resposta binária pode ser modelada usando muitas funções de link, como logit , probit , etc. Mas, logit aqui é...
Como interpretar os principais efeitos (coeficientes do fator codificado por dummy) em uma regressão de Poisson? Suponha o seguinte exemplo: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29,...
Ao responder a essa pergunta, John Christie sugeriu que o ajuste dos modelos de regressão logística fosse avaliado pela avaliação dos resíduos. Eu estou familiarizado com a interpretação de resíduos no OLS, eles estão na mesma escala que o DV e muito claramente a diferença entre y e y previstos...
Em geral, é recomendável obter a raiz quadrada quando você tiver dados de contagem. (Para alguns exemplos no CV, consulte a resposta de @ HarveyMotulsky aqui ou a resposta de @ whuber aqui .) Por outro lado, ao ajustar um modelo linear generalizado com uma variável de resposta distribuída como...
Existem vários tópicos neste site para recomendações de livros sobre estatísticas introdutórias e aprendizado de máquina, mas estou procurando um texto sobre estatísticas avançadas, incluindo, em ordem de prioridade: probabilidade máxima, modelos lineares generalizados, análise de componentes...
Estou tentando entender a filosofia por trás do uso de um modelo linear generalizado (GLM) vs um modelo linear (LM). Criei um exemplo de conjunto de dados abaixo em que: registro( y) = x + εregistro(y)=x+ε\log(y) = x + \varepsilon O exemplo não possui o erro em função da magnitude de y ,...
Digamos que eu tenho um objeto de classe glm(correspondente a um modelo de regressão logística) e gostaria de transformar as probabilidades previstas fornecidas predict.glmusando o argumento type="response"em respostas binárias, ou seja, ou Y = 0 . Qual é a maneira mais rápida e canônica de fazer...
Como são todas as versões do mesmo método estatístico
Como interpretar o desvio nulo e residual no GLM em R? Como, dizemos que AIC menor é melhor. Existe alguma interpretação semelhante e rápida para os desvios também? Desvio nulo: 1146,1 em 1077 graus de liberdade Desvio residual: 4589,4 em 1099 graus de liberdade AIC:
Em deste artigo intitulado "escolhendo entre lineares generalizados modelos aplicados a médico de dados", escrevem os autores: Em um modelo linear generalizado, a média é transformada pela função de link, em vez de transformar a própria resposta. Os dois métodos de transformação podem levar a...
Gostaria de saber se faz diferença na interpretação se apenas as variáveis dependentes, dependentes e independentes ou apenas as independentes são transformadas em log. Considere o caso de log(DV) = Intercept + B1*IV + Error Eu posso interpretar o IV como o aumento percentual, mas como isso...
Especificamente, quero saber se há uma diferença entre lm(y ~ x1 + x2)e glm(y ~ x1 + x2, family=gaussian). Penso que este caso particular de glm é igual a lm. Estou
Sei que estou perdendo algo no meu entendimento da regressão logística e realmente aprecio qualquer ajuda. Pelo que entendi, a regressão logística pressupõe que a probabilidade de um resultado '1' dado os insumos seja uma combinação linear dos insumos passados por uma função de logística...
Estou pensando em construir um modelo de previsão de uma relação , onde e e . Portanto, a proporção estaria entre e .a ≤ b a > 0 b > 0 0 1a/ba/ba/ba≤ba≤ba \le ba>0a>0a > 0b>0b>0b > 0000111 Eu poderia usar regressão linear, embora isso não se limite naturalmente a 0..1. Não tenho...
Esta pergunta é uma resposta a uma resposta dada por @Greg Snow em relação a uma pergunta que eu fiz sobre análise de potência com regressão logística e SAS Proc GLMPOWER. Se estou projetando um experimento e analisando os resultados em uma regressão logística fatorial, como posso usar a simulação...