Qual é a notação algébrica para calcular o intervalo de previsão para regressão múltipla? Parece bobagem, mas estou tendo problemas para encontrar uma notação algébrica clara disso.
Qual é a notação algébrica para calcular o intervalo de previsão para regressão múltipla? Parece bobagem, mas estou tendo problemas para encontrar uma notação algébrica clara disso.
Se a melhor aproximação linear (usando mínimos quadrados) dos meus pontos de dados é a linha y=mx+by=mx+by=mx+b , como posso calcular o erro de aproximação? Se o cálculo do desvio padrão da diferença entre as observações e previsões ei=real(xi)−(mxi+b)ei=real(xi)−(mxi+b)e_i=real(x_i)-(mx_i+b) , que...
A questão é muito simples: por que, quando tentamos ajustar um modelo aos nossos dados, lineares ou não lineares, geralmente tentamos minimizar a soma dos quadrados dos erros para obter nosso estimador para o parâmetro do modelo? Por que não escolher outra função objetiva para minimizar? Entendo...
Quando fazemos várias regressões e dizemos que estamos olhando para a mudança média na variável para uma mudança na variável , mantendo todas as outras variáveis constantes, em quais valores estamos mantendo as outras variáveis constantes? A média deles? Zero? Qualquer valor?xyyyxxx Estou...
Além de algumas circunstâncias únicas em que devemos absolutamente entender a relação média condicional, quais são as situações em que um pesquisador deve escolher o OLS em vez da regressão quantílica? Não quero que a resposta seja "se não houver utilidade para entender os relacionamentos da...
Considere a regressão de crista com uma restrição adicional exigindo que tenha soma unitária dos quadrados (equivalentemente, variação unitária); se necessário, pode-se supor que possui soma unitária dos quadrados:y^y^\hat{\mathbf y}yy\mathbf
Há uma imagem na página 204, capítulo 4 de "reconhecimento de padrões e aprendizado de máquina", de Bishop, onde não entendo por que a solução Menos Quadrada fornece resultados ruins aqui: O parágrafo anterior era sobre o fato de que as soluções de mínimos quadrados carecem de robustez para os...
Recentemente, descobri que na literatura econométrica aplicada, ao lidar com problemas de seleção de características, não é incomum executar o LASSO seguido de uma regressão OLS usando as variáveis selecionadas. Fiquei me perguntando como podemos qualificar a validade de tal procedimento....
Começo com minha regressão OLS: y=β0+β1x1+β2D+εy=β0 0+β1x1+β2D+ε y = \beta _0 + \beta_1x_1+\beta_2 D + \varepsilon onde D é uma variável dummy, as estimativas tornam-se diferentes de zero com um baixo valor de p. Em seguida, pré-formao um teste de Ramsey RESET e descobri que tenho alguma...
Sei como calcular matematicamente PCA e SVD e sei que ambos podem ser aplicados à regressão de mínimos quadrados lineares. A principal vantagem do SVD matematicamente parece ser que ele pode ser aplicado a matrizes não quadradas. Ambos focam na decomposição da matrizAlém da vantagem do SVD...
Li esta afirmação em um antigo exame verdadeiro / falso: Podemos obter várias soluções ótimas locais se resolvermos um problema de regressão linear, minimizando a soma dos erros ao quadrado usando a descida do gradiente. Solução: Falso Minha pergunta é: qual parte dessa pergunta está errada?...
De Uma Introdução à Aprendizagem Estatística de James et al., A estimativa de validação cruzada de saída única (LOOCV) é definida por que .cv( N )= 1n∑i = 1nMSEEucv(n)=1n∑Eu=1nMSEEu\text{CV}_{(n)} = \dfrac{1}{n}\sum\limits_{i=1}^{n}\text{MSE}_iMSEEu= ( yEu- y^Eu)2MSEEu=(yEu-y^Eu)2\text{MSE}_i =...
Se é a classificação completa, o inverso de existe e obtemos a estimativa de mínimos quadrados: eX t X β = ( X T X ) - 1 X Y Var ( β ) = σ 2 ( X T X )XXXXTXXTXX^TXβ^=(XTX)−1XYβ^=(XTX)−1XY\hat\beta = (X^TX)^{-1}XYVar(β^)=σ2(XTX)−1Var(β^)=σ2(XTX)−1\operatorname{Var}(\hat\beta) =...
A impressão que tive, com base em vários artigos, livros e artigos que li, é que a maneira recomendada de ajustar uma distribuição de probabilidade em um conjunto de dados é usando a estimativa de máxima verossimilhança (MLE). No entanto, como físico, uma maneira mais intuitiva é ajustar apenas o...
Estou tentando ajustar uma regressão para explicar o número de homicídios em cada distrito de uma cidade. Embora eu saiba que meus dados seguem uma distribuição Poisson, tentei ajustar um OLS como este: l o g( y+ 1 ) = α + βX+ ϵeuog(y+1)=α+βX+ϵlog(y+1) = \alpha + \beta X + \epsilon Então, eu...
Eu queria saber se existe uma relação entre e um teste-F.R2R2R^2 Normalmente, R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1} e mede a intensidade da relação linear na regressão. Um teste F apenas prova uma...
Eu tenho uma pergunta sobre o viés variável omitido na regressão logística e linear. Digamos que eu omita algumas variáveis de um modelo de regressão linear. Finja que essas variáveis omitidas não estão correlacionadas com as variáveis que incluí no meu modelo. Essas variáveis omitidas...
Eu vi essa lista aqui e não podia acreditar que havia tantas maneiras de resolver mínimos quadrados. As "equações normais" na Wikipedia pareciam ser um caminho bastante direto: α^β^=y¯−β^x¯,=∑ni=1(xi−x¯)(yi−y¯)∑ni=1(xi−x¯)2α^=y¯−β^x¯,β^=∑i=1n(xi−x¯)(yi−y¯)∑i=1n(xi−x¯)2 {\displaystyle...
Este link da Wikipedia lista uma série de técnicas para detectar a heterocedasticidade dos resíduos de OLS. Eu gostaria de aprender qual técnica prática é mais eficiente na detecção de regiões afetadas pela heterocedasticidade. Por exemplo, aqui a região central do gráfico OLS 'Residuals vs...
Considere um problema de regressão OLS padrão : Eu tenho matrizes e \ X e quero encontrar \ B para minimizar L = \ | \ Y- \ X \ B \ | ^ 2. A solução é dada por \ hat \ B = \ argmin_ \ B \ {L \} = (\ X ^ \ top \ X) ^ + \ X ^ \ top \ Y.\newcommand{\Y}{\mathbf Y}\newcommand{\X}{\mathbf...