Perguntas com a marcação «regression»

13
Quando usar um GAM vs GLM

Sei que essa pode ser uma questão potencialmente ampla, mas fiquei imaginando se existem suposições generalizáveis ​​que indicam o uso de um GAM (modelo aditivo generalizado) sobre um GLM (modelo linear generalizado)? Alguém me disse recentemente que os GAMs devem ser usados ​​apenas quando eu...

13
Eliminando valores discrepantes com base em "2,5 vezes o RMSE"

Em Kahneman e Deaton (2010) † , os autores escrevem o seguinte:††^\dagger Essa regressão explica 37% da variância, com um erro quadrático médio da raiz (RMSE) de 0,67852. Para eliminar discrepâncias e relatórios de renda implausíveis, retiramos observações nas quais o valor absoluto da diferença...

12
Atualizando o ajuste do laço com novas observações

Estou ajustando uma regressão linear regularizada por L1 a um conjunto de dados muito grande (com n >> p.) As variáveis ​​são conhecidas antecipadamente, mas as observações chegam em pequenos pedaços. Eu gostaria de manter o ajuste do laço após cada pedaço. Obviamente, posso reorganizar todo...

12
Entendendo a regressão SVM: função objetivo e “nivelamento”

SVMs para classificação fazem sentido intuitivamente para mim: eu entendo como minimizar ||θ||2||θ||2||\theta||^2 produz a margem máxima. No entanto, não entendo esse objetivo no contexto de regressão. Vários textos ( aqui e aqui ) descrevem isso como maximização da "planicidade". Por que queremos...

12
Testando a diferença na AIC de dois modelos não aninhados

O ponto principal da AIC ou de qualquer outro critério de informação é que menos é melhor. Portanto, se eu tiver dois modelos M1: y = a0 + XA + e e M2: y = b0 + ZB + u, e se o AIC do primeiro (A1) for menor que o do segundo (A2), então M1 terá um melhor ajuste do ponto de vista da teoria da...

12
Diferença entre teste t e ANOVA na regressão linear

Gostaria de saber quais são as diferenças entre o teste t e a ANOVA na regressão linear? É um teste t para testar se alguma das pistas e interceptação tem média zero, enquanto a ANOVA para testar se todas as pistas têm média zero? Essa é a única diferença entre eles? Na regressão linear simples,...