A regressão múltipla e multivariada é realmente diferente? O que é uma variável de qualquer
A regressão múltipla e multivariada é realmente diferente? O que é uma variável de qualquer
É possível ter uma equação de regressão (múltipla) com duas ou mais variáveis dependentes? Claro, você pode executar duas equações de regressão separadas, uma para cada DV, mas isso não parece capturar qualquer relação entre os dois
A temporada de férias me deu a oportunidade de me aconchegar ao lado do fogo com Os elementos do aprendizado estatístico . Vindo de uma perspectiva econométrica (freqüentista), estou tendo problemas para entender os usos de métodos de encolhimento, como regressão de cume, laço e regressão de menor...
Alguém pode me explicar por que alguém escolheria um parâmetro paramétrico em vez de um método estatístico não paramétrico para teste de hipóteses ou análise de regressão? Na minha opinião, é como fazer rafting e escolher um relógio não resistente à água, porque você pode não o molhar. Por que...
Pelo que sei, o uso do laço para seleção de variáveis lida com o problema de entradas correlacionadas. Além disso, como é equivalente à regressão de menor ângulo, não é lento computacionalmente. No entanto, muitas pessoas (por exemplo, pessoas que conheço fazendo bioestatística) ainda parecem...
O que se quer dizer quando dizemos que temos um modelo
Entendo que a estimativa de regressão de crista é o que minimiza a soma residual do quadrado e uma penalidade no tamanho deββ\betaββ\beta βridge=(λID+X′X)−1X′y=argmin[RSS+λ∥β∥22]βridge=(λID+X′X)−1X′y=argmin[RSS+λ‖β‖22]\beta_\mathrm{ridge} = (\lambda I_D + X'X)^{-1}X'y = \operatorname{argmin}\big[...
Quais técnicas estão disponíveis para recolher (ou agrupar) muitas categorias para algumas, com o objetivo de usá-las como uma entrada (preditora) em um modelo estatístico? Considere uma variável como estudante universitário (disciplina escolhida por um estudante de graduação). É desordenado e...
Eu tenho um modelo (misto) em que um dos meus preditores deve, a priori, estar relacionado quadraticamente ao preditor (devido à manipulação experimental). Por isso, gostaria de adicionar apenas o termo quadrático ao modelo. Duas coisas me impedem de fazê-lo: Acho que li em algum lugar que você...
Eu tenho algumas perguntas sobre a regressão bayesiana: Dada uma regressão padrão como . Se eu quiser mudar isso para uma regressão bayesiana, preciso de distribuições anteriores para e (ou não funciona dessa maneira)?y=β0+β1x+εy=β0+β1x+εy = \beta_0 + \beta_1 x +
Eu continuo lendo isso e intuitivamente eu posso ver isso, mas como se passa da regularização L2 para dizer que este é um prior gaussiano analiticamente? O mesmo vale para dizer que L1 é equivalente a um anterior do Laplacean. Quaisquer outras referências seriam ótimas.
Estou tentando prever um resultado binário usando 50 variáveis explicativas contínuas (o intervalo da maioria das variáveis é a ). Meu conjunto de dados tem quase 24.000 linhas. Quando corro no R, recebo:−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm did not converge 2:...
Para resolver problemas de seleção de modelos, vários métodos (LASSO, regressão de crista, etc.) reduzirão os coeficientes das variáveis preditivas em direção a zero. Estou procurando uma explicação intuitiva sobre por que isso melhora a capacidade preditiva. Se o verdadeiro efeito da variável...
fundo Estou fazendo pesquisa clínica em medicina e fiz vários cursos de estatística. Nunca publiquei um artigo usando regressão linear / logística e gostaria de fazer a seleção de variáveis corretamente. A interpretabilidade é importante, portanto, não há técnicas sofisticadas de aprendizado de...
Eu gostaria de ter muitos algoritmos que executam a mesma tarefa que a regressão logística. Ou seja, algoritmos / modelos que podem fornecer uma previsão para uma resposta binária (Y) com alguma variável explicativa (X). Eu ficaria feliz se, depois de nomear o algoritmo, se você também mostrar...
Resumindo , quanto mais aprendo sobre estatística, menos confio em artigos publicados em meu campo; Simplesmente acredito que os pesquisadores não estão fazendo suas estatísticas suficientemente bem. Sou leigo, por assim dizer. Sou formado em biologia, mas não tenho educação formal em...
Vamos supor que você seja um pesquisador / economista de ciências sociais tentando encontrar preditores relevantes de demanda por um serviço. Você tem duas variáveis dependentes / de resultado que descrevem a demanda (usando o serviço sim / não e o número de ocasiões). Você tem 10 variáveis...
Trabalho com R há algum tempo e já me deparei com coisas como decomposições de PCA, SVD, QR e muitos desses resultados de álgebra linear (ao inspecionar estimativas de regressões ponderadas e outras), então eu queria saber se alguém tem uma recomendação sobre um bom livro abrangente de álgebra...
Parece que é possível obter resultados semelhantes a uma rede neural com regressão linear multivariada em alguns casos, e a regressão linear multivariada é super rápida e fácil. Sob quais circunstâncias as redes neurais podem dar melhores resultados do que a regressão linear...
O que significa ter "variação constante" no termo de erro? A meu ver, temos dados com uma variável dependente e uma variável independente. A variação constante é um dos pressupostos da regressão linear. Estou imaginando o que significa homoscedasticidade. Como mesmo se eu tiver 500 linhas, eu teria...