Estou um pouco confuso se uma variável independente (também chamada de preditor ou recurso) em um modelo estatístico, por exemplo, o na regressão linear , é uma variável aleatória?Y = β 0 + β 1 XXXXY=β0+β1XY=β0 0+β1XY=\beta_0+\beta_1
Estou um pouco confuso se uma variável independente (também chamada de preditor ou recurso) em um modelo estatístico, por exemplo, o na regressão linear , é uma variável aleatória?Y = β 0 + β 1 XXXXY=β0+β1XY=β0 0+β1XY=\beta_0+\beta_1
Desejo entender melhor os prós / contras do uso de splines loess ou suavizantes para suavizar alguma curva. Outra variação da minha pergunta é se existe uma maneira de construir um spline de suavização de uma maneira que produza os mesmos resultados que usar loess. Qualquer referência ou insight...
Tenho várias perguntas sobre a penalidade de cordilheira no contexto de mínimos quadrados: βr i dge= ( λ ID+ X′X)- 1X′yβridge=(λID+X′X)−1X′y\beta_{ridge} = (\lambda I_D + X'X)^{-1}X'y 1) A expressão sugere que a matriz de covariância de X é reduzida em direção a uma matriz diagonal, o que...
O que é um estudo de ablação? E existe uma maneira sistemática de realizá-lo? Por exemplo, eu tenho preditores em uma regressão linear que chamarei de modelo.nnn Como vou realizar um estudo de ablação para isso? Quais métricas devo usar? Uma fonte ou livro abrangente seria apreciado....
Seguindo minha pergunta para o OLS , pergunto-me: que gráficos de diagnóstico existem para a regressão quantílica? (e há R implementação deles?) Uma rápida pesquisa no Google já veio com o gráfico de worms (sobre o qual nunca ouvi falar antes), e ficaria feliz em saber de mais métodos que você...
O aprendizado de máquina (ML) usa fortemente técnicas de regressão linear e logística. Ele também se baseia em técnicas de engenharia recurso ( feature transform, kernel, etc.). Porque é que nada sobre variable transformation(por exemplo power transformation) mencionados no ML? (Por exemplo, eu...
Qual é a notação algébrica para calcular o intervalo de previsão para regressão múltipla? Parece bobagem, mas estou tendo problemas para encontrar uma notação algébrica clara disso.
É possível realizar uma regressão se todas as variáveis dependentes e independentes forem variáveis
Estou interessado no significado geométrico da correlação múltipla e no coeficiente de determinação na regressão ou em notação vetorial,R 2 y i = β 1 + β 2 x 2 , i + ⋯ + β k x k , i + ϵ iRRRR2R2R^2yi=β1+β2x2,i+⋯+βkxk,i+ϵiyi=β1+β2x2,i+⋯+βkxk,i+ϵiy_i = \beta_1 + \beta_2 x_{2,i} + \dots + \beta_k...
No começo, pensei que a ordem não importava, mas depois li sobre o processo de ortogonalização de Gram-Schmidt para calcular vários coeficientes de regressão, e agora estou pensando melhor. De acordo com o processo de gram-schmidt, quanto mais tarde uma variável explicativa for indexada entre as...
Ao construir um modelo de regressão em R ( lm), estou frequentemente recebendo esta mensagem "there are aliased coefficients in the model" O que exatamente isso significa? Além disso, devido a isso predict()também está dando um aviso. Embora seja apenas um aviso, quero saber como podemos...
O New York Times tem um longo comentário sobre o sistema de avaliação de professores de "valor agregado" usado para dar feedback aos educadores da cidade de Nova York. O lede é a equação usada para calcular as pontuações - apresentadas sem contexto. A estratégia retórica parece ser intimidação via...
Quero saber por que a regressão logística é chamada de modelo linear. Ele usa uma função sigmóide, que não é linear. Então, por que a regressão logística é um modelo
Problema Na regressão, geralmente calcula-se o erro quadrático médio (MSE) de uma amostra: para medir a qualidade de um preditor.MSE=1n∑i=1n(g(xi)−gˆ(xi))2MSE=1n∑i=1n(g(xi)−g^(xi))2 \text{MSE} = \frac{1}{n} \sum_{i=1}^n\left(g(x_i) - \widehat{g}(x_i)\right)^2 No momento, estou trabalhando em...
Entendo qual o papel do lambda em uma regressão com rede elástica. E eu posso entender por que alguém selecionaria lambda.min, o valor de lambda que minimiza o erro validado cruzado. Minha pergunta é: Onde na literatura estatística é recomendado usar lambda.1se, que é o valor de lambda que...
Atualmente, estou usando o AnomalyDetection do Twitter em R: https://github.com/twitter/AnomalyDetection . Esse algoritmo fornece detecção de anomalia de séries temporais para dados com sazonalidade. Pergunta: existem outros algoritmos semelhantes a este (controlar a sazonalidade não...
Se a melhor aproximação linear (usando mínimos quadrados) dos meus pontos de dados é a linha y=mx+by=mx+by=mx+b , como posso calcular o erro de aproximação? Se o cálculo do desvio padrão da diferença entre as observações e previsões ei=real(xi)−(mxi+b)ei=real(xi)−(mxi+b)e_i=real(x_i)-(mx_i+b) , que...
Na análise de regressão linear, analisamos valores extremos, investigamos a multicolinearidade, testamos a heterocedasticidade. A questão é: existe alguma ordem para aplicá-las? Quero dizer, temos que analisar discrepantes muito primeiro e depois examinar a multicolinearidade? Ou reverter?...
ANOVA vs regressão linear múltipla? Entendo que ambos os métodos parecem usar o mesmo modelo estatístico. No entanto, em que circunstâncias devo usar qual método? Quais são as vantagens e desvantagens desses métodos quando comparados? Por que a ANOVA é tão comumente usada em estudos...
Existe uma relação entre regressão e análise discriminante linear (LDA)? Quais são suas semelhanças e diferenças? Faz alguma diferença se houver duas classes ou mais de duas