Qual é a diferença entre o modelo Logit e Probit ? Estou mais interessado aqui em saber quando usar a regressão logística e quando usar o Probit. Se houver alguma literatura que o defina usando R , isso também seria
Qual é a diferença entre o modelo Logit e Probit ? Estou mais interessado aqui em saber quando usar a regressão logística e quando usar o Probit. Se houver alguma literatura que o defina usando R , isso também seria
Qual é a diferença entre os termos 'função de link' e 'função de link canônico'? Além disso, existem vantagens (teóricas) em usar uma sobre a outra? Por exemplo, uma variável de resposta binária pode ser modelada usando muitas funções de link, como logit , probit , etc. Mas, logit aqui é...
Estou tentando entender a filosofia por trás do uso de um modelo linear generalizado (GLM) vs um modelo linear (LM). Criei um exemplo de conjunto de dados abaixo em que: registro( y) = x + εregistro(y)=x+ε\log(y) = x + \varepsilon O exemplo não possui o erro em função da magnitude de y ,...
Uma distribuição gaussiana padronizada em pode ser definida fornecendo explicitamente sua densidade: RR\mathbb{R}12π−−√e−x2/212πe−x2/2 \frac{1}{\sqrt{2\pi}}e^{-x^2/2} ou sua função característica. Como lembrado nesta pergunta, também é a única distribuição para a qual a média e a variância da...
Gostaria de saber se faz diferença na interpretação se apenas as variáveis dependentes, dependentes e independentes ou apenas as independentes são transformadas em log. Considere o caso de log(DV) = Intercept + B1*IV + Error Eu posso interpretar o IV como o aumento percentual, mas como isso...
Espero que alguém possa explicar, em termos leigos, o que é uma função característica e como é usada na prática. Eu li que é a transformação de Fourier do pdf, então acho que sei o que é, mas ainda não entendo seu propósito. Se alguém pudesse fornecer uma descrição intuitiva de seu objetivo e...
Qual é o objetivo da função de link como um componente do modelo linear generalizado? Por que precisamos disso? A Wikipedia afirma: Pode ser conveniente corresponder o domínio da função de link ao intervalo da média da função de distribuição Qual é a vantagem de fazer...
Estou usando o sinal de intercalação para executar uma floresta aleatória validada cruzada em um conjunto de dados. A variável Y é um fator. Não há NaN, Inf ou NA no meu conjunto de dados. No entanto, ao executar a floresta aleatória, recebo Error in randomForest.default(m, y, ...) : NA/NaN/Inf...
Estou lendo sobre a função quantil, mas não está claro para mim. Você poderia fornecer uma explicação mais intuitiva do que a fornecida abaixo? Como o cdf é uma função monotonicamente crescente, ele tem um inverso; vamos denotar isso por . Se é o cdf de , então é o valor de tal que ; isso é...
Eu tenho uma pergunta sobre semântica na qual gostaria que as opiniões de colegas estatísticos. Sabemos que modelos como logística, Poisson etc. se enquadram nos modelos lineares generalizados. O modelo inclui funções não lineares dos parâmetros, que por sua vez podem ser modelados usando a...
Precisão é definida como: p = true positives / (true positives + false positives) É verdade que, como true positivese false positivesabordagem 0, a precisão se aproxima de 1? Mesma pergunta para recall: r = true positives / (true positives + false negatives) No momento, estou implementando...
Quase tudo o que li sobre regressão linear e GLM se resume a isso: y=f(x,β)y=f(x,β)y = f(x,\beta) onde f(x,β)f(x,β)f(x,\beta) é uma função não-crescente ou não-decrescente de xxx e é o parâmetro que você estima e testar hipóteses sobre. Existem dezenas de funções de link e transformações de e para...
Acabei de notar que a integração da função quantílica de uma variável aleatória univariada (cdf inverso) de p = 0 ep = 1 produz a média da variável. Eu não tinha ouvido falar desse relacionamento até agora, então estou me perguntando: esse é sempre o caso? Em caso afirmativo, essa relação é...
Estou tentando entender o vínculo entre a função geradora de momento e a função característica. A função geradora de momento é definida como: MX(t)=E(exp(tX))=1+tE(X)1+t2E(X2)2!+⋯+tnE(Xn)n!MX(t)=E(exp(tX))=1+tE(X)1+t2E(X2)2!+⋯+tnE(Xn)n! M_X(t) = E(\exp(tX)) = 1 + \frac{t E(X)}{1} + \frac{t^2...
Eu tenho dados de densidade de peixes que estou tentando comparar entre várias técnicas de coleta diferentes, os dados têm muitos zeros e o histograma parece vaugley apropriado para uma distribuição de poisson, exceto que, como densidades, não são dados inteiros. Sou relativamente novo nos GLMs e...
Eu acho que tenho alguma confusão fundamental sobre como as funções da regressão logística funcionam (ou talvez apenas funcionem como um todo). Como é que a função h (x) produz a curva vista à esquerda da imagem? Vejo que esse é um gráfico de duas variáveis, mas essas duas variáveis (x1 e x2)...
Se é um CDF, parece que ( ) também é um CDF.F Z ( z ) α α > 0FZFZF_ZFZ(z)αFZ(z)αF_Z(z)^\alphaα > 0α>0\alpha \gt 0 P: Esse é um resultado padrão? P: Existe uma boa maneira de encontrar uma função com st , ondeX ≡ g ( Z ) F X ( x ) = F Z ( z ) α x ≡ g ( z )gggX≡ g( Z)X≡g(Z)X \equiv g(Z)FX(...
Eu estive pensando sobre este problema. A função logística usual para modelar dados binários é: No entanto, a função logit, que é uma curva em forma de S, é sempre a melhor para modelar os dados? Talvez você tenha motivos para acreditar que seus dados não seguem a curva normal em forma de S, mas...
Eu tenho um modelo linear generalizado que adota uma função Gaussiana de distribuição e link de log. Depois de ajustar o modelo, verifico os resíduos: gráfico QQ, resíduos versus valores previstos, histograma de resíduos (reconhecendo que é necessária a devida cautela). Tudo parece bem. Isso parece...
Inspirado em minha outra pergunta , gostaria de perguntar como encontrar o modo de uma função de densidade de probabilidade (PDF) de uma função f(x)f(x)f(x) ? Existe algum procedimento de "livro de receitas" para isso? Aparentemente, essa tarefa é muito mais difícil do que parece à primeira...