Alguém sabe como descobrir se os pontos 7, 16 e 29 são pontos influentes ou não? Li em algum lugar que, como a distância de Cook é menor que 1, eles não são. Estou certo?
Alguém sabe como descobrir se os pontos 7, 16 e 29 são pontos influentes ou não? Li em algum lugar que, como a distância de Cook é menor que 1, eles não são. Estou certo?
Estou tendo alguns problemas com a derivação da solução para regressão de crista. Conheço a solução de regressão sem o termo de regularização: β=(XTX)−1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. Porém, após adicionar o termo L2 à função cost, como é que a solução se...
Eu tenho várias covariáveis no meu cálculo para um modelo e nem todas são estatisticamente significativas. Devo remover aqueles que não são? Esta pergunta discute o fenômeno, mas não responde à minha pergunta: Como interpretar o efeito não significativo de uma covariável na ANCOVA? Não há nada...
A regressão de menor ângulo e o laço tendem a produzir caminhos de regularização muito semelhantes (idênticos, exceto quando um coeficiente cruza zero). Ambos podem ser eficientemente ajustados por algoritmos praticamente idênticos. Existe alguma razão prática para preferir um método ao...
Minha pergunta é: precisamos padronizar o conjunto de dados para garantir que todas as variáveis tenham a mesma escala, entre [0,1], antes de ajustar a regressão logística. A fórmula é: xEu- min ( xEu)max ( xEu) - min ( xEu)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} Meu...
Sou bastante novo nisso com testes de dados binomiais, mas precisava fazer um e agora não tenho certeza de como interpretar o resultado. A variável y, a variável resposta, é binomial e os fatores explicativos são contínuos. Isto é o que recebi ao resumir o resultado: glm(formula = leaves.presence...
Estou tentando executar uma regressão OLS: DV: Alteração de peso ao longo de um ano (peso inicial - peso final) IV: Se você se exercita ou não. No entanto, parece razoável que pessoas mais pesadas percam mais peso por unidade de exercício do que pessoas mais magras. Assim, eu queria incluir uma...
Notei que em R, Poisson e regressões binomiais negativas (RN) sempre parecem se encaixar nos mesmos coeficientes para preditores categóricos, mas não contínuos. Por exemplo, aqui está uma regressão com um preditor categórico: data(warpbreaks) library(MASS) rs1 = glm(breaks ~ tension,...
Se a regressão polinomial modela relações não lineares, como pode ser considerado um caso especial de regressão linear múltipla? A Wikipedia observa que "Embora a regressão polinomial ajuste um modelo não linear aos dados, como um problema de estimativa estatística é linear, no sentido de que a...
Estou fazendo uma regressão multivariada de Cox, tenho minhas variáveis independentes significativas e valores beta. O modelo se ajusta muito bem aos meus dados. Agora, eu gostaria de usar meu modelo e prever a sobrevivência de uma nova observação. Não estou claro como fazer isso com um modelo...
τt hτth\tau^{th} βˆQ R= minb∑i = 1nρτ( yEu- X′Eubτ)β^QR=minb∑Eu=1nρτ(yEu-XEu′bτ) \widehat{\beta}_{QR} = \min_{b} \sum^{n}_{i=1} \rho_\tau (y_i - X'_i b_\tau) ρτ= uEu⋅ ( τ- 1 ( uEu< 0 ) )ρτ=vocêEu⋅(τ-1(vocêEu<0 0))\rho_\tau = u_i\cdot (\tau -
Para o gráfico 1, posso testar a associação entre x e y, fazendo uma correlação simples. Para o gráfico 2, onde o relacionamento não é linear e ainda existe uma relação clara entre x e y, como posso testar a associação e rotular sua natureza?
Fiquei me perguntando que diferença e relação existem entre previsão e previsão? Especialmente em séries temporais e regressão? Por exemplo, estou correto que: Em séries temporais, a previsão parece significar estimar valores futuros, dados valores passados de uma série temporal. Na regressão,...
Alguém pode me dar alguma intuição sobre quando escolher SVM ou LR? Quero entender a intuição por trás da diferença entre os critérios de otimização de aprender o hiperplano dos dois, onde os respectivos objetivos são os seguintes: SVM: tente maximizar a margem entre os vetores de suporte mais...
Na página 223 em Introdução ao aprendizado estatístico , os autores resumem as diferenças entre regressão de cordilheira e laço. Eles fornecem um exemplo (Figura 6.9) de quando "o laço tende a superar a regressão da crista em termos de viés, variância e MSE". Entendo por que o laço pode ser...
Eu tenho 2 perguntas simples sobre regressão linear: Quando é aconselhável padronizar as variáveis explicativas? Uma vez que a estimativa é realizada com valores padronizados, como se pode prever com novos valores (como se deve padronizar os novos valores)? Algumas referências seriam úteis....
Atualmente, estou usando o pacote R lme4 . Estou usando um modelo linear de efeitos mistos com efeitos aleatórios: library(lme4) mod1 <- lmer(r1 ~ (1 | site), data = sample_set) #Only random effects mod2 <- lmer(r1 ~ p1 + (1 | site), data = sample_set) #One fixed effect + # random...
Quero assumir que a temperatura da superfície do mar no Mar Báltico é a mesma ano após ano e depois descrevê-la com um modelo de função / linear. A idéia que tive foi apenas inserir o ano como um número decimal (ou num_months / 12) e descobrir qual deveria ser a temperatura naquele momento....
TL, DR: Parece que, ao contrário do conselho muitas vezes repetida, leave-one-out validação cruzada (LOO-CV) - isto é,CV fold com(o número de dobras) igual a(o número das observações de treinamento) - produz estimativas do erro de generalização que é a menor variável para qualquer, não a mais...
Estou lendo um livro sobre regressão linear e tenho alguns problemas para entender a matriz de variância-covariância de bb\mathbf{b} : Os itens diagonais são fáceis, mas os fora da diagonal são um pouco mais difíceis, o que me intriga é que