Qual é a diferença entre o modelo Logit e Probit ? Estou mais interessado aqui em saber quando usar a regressão logística e quando usar o Probit. Se houver alguma literatura que o defina usando R , isso também seria
Uma transformação de um parâmetro que rege uma distribuição de resposta que é usada como uma parte crucial do modelo linear generalizado para mapear o intervalo desse parâmetro (que pode ser de 0 a 1, ou apenas valores positivos, por exemplo) para a reta numérica real . ( - ∞ , + ∞ ) (−∞,+∞)
Qual é a diferença entre o modelo Logit e Probit ? Estou mais interessado aqui em saber quando usar a regressão logística e quando usar o Probit. Se houver alguma literatura que o defina usando R , isso também seria
Qual é a diferença entre os termos 'função de link' e 'função de link canônico'? Além disso, existem vantagens (teóricas) em usar uma sobre a outra? Por exemplo, uma variável de resposta binária pode ser modelada usando muitas funções de link, como logit , probit , etc. Mas, logit aqui é...
Estou tentando entender a filosofia por trás do uso de um modelo linear generalizado (GLM) vs um modelo linear (LM). Criei um exemplo de conjunto de dados abaixo em que: registro( y) = x + εregistro(y)=x+ε\log(y) = x + \varepsilon O exemplo não possui o erro em função da magnitude de y ,...
Qual é o objetivo da função de link como um componente do modelo linear generalizado? Por que precisamos disso? A Wikipedia afirma: Pode ser conveniente corresponder o domínio da função de link ao intervalo da média da função de distribuição Qual é a vantagem de fazer...
Eu tenho uma pergunta sobre semântica na qual gostaria que as opiniões de colegas estatísticos. Sabemos que modelos como logística, Poisson etc. se enquadram nos modelos lineares generalizados. O modelo inclui funções não lineares dos parâmetros, que por sua vez podem ser modelados usando a...
Precisão é definida como: p = true positives / (true positives + false positives) É verdade que, como true positivese false positivesabordagem 0, a precisão se aproxima de 1? Mesma pergunta para recall: r = true positives / (true positives + false negatives) No momento, estou implementando...
Quase tudo o que li sobre regressão linear e GLM se resume a isso: y=f(x,β)y=f(x,β)y = f(x,\beta) onde f(x,β)f(x,β)f(x,\beta) é uma função não-crescente ou não-decrescente de xxx e é o parâmetro que você estima e testar hipóteses sobre. Existem dezenas de funções de link e transformações de e para...
Eu tenho dados de densidade de peixes que estou tentando comparar entre várias técnicas de coleta diferentes, os dados têm muitos zeros e o histograma parece vaugley apropriado para uma distribuição de poisson, exceto que, como densidades, não são dados inteiros. Sou relativamente novo nos GLMs e...
Eu estive pensando sobre este problema. A função logística usual para modelar dados binários é: No entanto, a função logit, que é uma curva em forma de S, é sempre a melhor para modelar os dados? Talvez você tenha motivos para acreditar que seus dados não seguem a curva normal em forma de S, mas...
Eu tenho um modelo linear generalizado que adota uma função Gaussiana de distribuição e link de log. Depois de ajustar o modelo, verifico os resíduos: gráfico QQ, resíduos versus valores previstos, histograma de resíduos (reconhecendo que é necessária a devida cautela). Tudo parece bem. Isso parece...
Eu pensei que a função de ligação canônica vem do parâmetro natural da família exponencial. Digamos, considere a família então é a função de link canônico. Tomemos a distribuição de Bernoulli como exemplo, temos Portanto, a função de link
Fundo: Estou tentando seguir a revisão de Princeton sobre a estimativa de MLE para GLM . I compreender os conceitos básicos de estimativa MLE: likelihood, score, observado e esperado Fisher informationea Fisher scoringtécnica. E eu sei como justificar a regressão linear simples com a estimativa...
Estou realizando uma regressão de Poisson com o objetivo final de comparar (e tendo a diferença de) as contagens médias previstas entre dois níveis de fator no meu μ^1- μ^2μ^1-μ^2\hat{\mu}_1-\hat{\mu}_2 , mantendo outras variáveis do modelo (que são todos binária ) constante. Eu queria saber se...
Dado o mesmo conjunto de covariáveis e família de distribuição, como posso comparar modelos com diferentes funções de link? Acho que a resposta correta aqui é "AIC / BIC", mas não tenho 100% de certeza. É possível ter modelos aninhados se eles tiverem um link
Para um exemplo simples, assuma que existem dois modelos de regressão linear Modelo 1 tem três preditores, x1a, x2b, ex2c O modelo 2 possui três preditores do modelo 1 e dois preditores adicionais x2aex2b Existe uma equação de regressão populacional em que a variação populacional explicada é...
Eu quero ajustar um modelo linear por R com family=binomial(link="identity"), no entanto, a família binomial não tem vínculo de identidade. O que devo
Atualmente, estou trabalhando para modelar mortes por AIDS ao longo do tempo usando um GLM em R. Sei que existem duas opções possíveis para a função de link para dados de Poisson, log e raiz quadrada. Eu sei que a raiz quadrada resolveria problemas de variabilidade, enquanto o log é necessário...
Estou tentando estimar um modelo de escolha ocupacional com três opções. Existem alternativas ao uso da regressão logística multinomial ao lidar com esses resultados categóricos não ordenados? Ao lidar com variáveis dependentes binárias, parece haver várias opções, como o modelo LPM, bem como o...
Então, aqui estou estudando modelos lineares generalizados. Sei que essa pergunta é bastante ingênua e simples, mas não sei exatamente por que a função canônica do link é tão útil. Alguém poderia me fornecer uma intuição sobre esse