TLDR: As splines de regressão em placas finas têm uma interpretação probabilística / bayesiana? Dado pares de entrada-saída (xi,yi)(xi,yi)(x_i,y_i) , i=1,...,ni=1,...,ni=1,...,n ; Eu quero estimar uma função f(⋅)f(⋅)f(\cdot) seguinte forma
TLDR: As splines de regressão em placas finas têm uma interpretação probabilística / bayesiana? Dado pares de entrada-saída (xi,yi)(xi,yi)(x_i,y_i) , i=1,...,ni=1,...,ni=1,...,n ; Eu quero estimar uma função f(⋅)f(⋅)f(\cdot) seguinte forma
A página da Wikipedia sobre R2 diz que pode assumir um valor maior que 1. Eu não vejo como isso é possível.R2R2R^2 Valores de fora do intervalo de 0 a 1 pode ocorrer, onde ele é usado para medir a concordância entre os valores observados e modeladas e em que os valores "modelados" não são...
Eu tenho dois preditores em um modelo de regressão logística binária: um binário e um contínuo. Meu objetivo principal é comparar os coeficientes dos dois preditores dentro do mesmo modelo. Encontrei a sugestão de Andrew Gelman para padronizar variáveis de entrada de regressão contínua: I)...
Temos uma resposta e preditoresY∈RnY∈RnY \in \Bbb R^nX=(x1,x2,⋯,xm)T∈Rn×mX=(x1,x2,⋯,xm)T∈Rn×mX = (x_1, x_2, \cdots, x_m)^T \in \Bbb R^{n \times m} O problema que queremos resolver é argmink∈Rm(∥Y−Xk∥22+λ∥k∥0)→k0argmink∈Rm(‖Y−Xk‖22+λ‖k‖0)→k0\text{argmin}_{k \in \Bbb R^{m}} (\Vert Y - Xk \Vert_2^2...
Na regressão em geral e na regressão linear, em particular, a interpretação causal sobre parâmetros é às vezes permitida. Pelo menos na literatura econométrica, mas não somente quando a interpretação causal é permitida, não é tão claro; Para uma discussão, você pode ver: Regressão e Causação: Um...
Suponha que você ajuste um modelo . Existem implicações práticas para a estimativa do efeito da interação se e estiverem correlacionados?y= x1+ x2+ x1× x2y=x1+x2+x1×x2y = x_1 + x_2 + x_1\times x_2x1x1x_1x2x2x_2 Entendo que poderia haver problemas de colinearidade se e estiverem muito...
Como formular regressão quantílica como um problema de programação linear? Ao olhar para o problema mediano dos quantis, sei que é minimize transforms into minimize s.t.∑i=1n|β0+Xiβ1−Yi|∑i=1neiei≥β0+Xiβ1−Yiei≥−(β0+Xiβ1−Yi)minimize ∑i=1n|β0+Xiβ1−Yi|transforms...
Suponha que observemos os dados e gostaríamos de ajustar um modelo de regressão para . Infelizmente, às vezes é medido com erros cuja média é diferente de zero.Y, XY,XY, XE [ Y|X]E[Y|X]\mathbf{E}[Y \,|\, X]YYY Deixe indicando se é medido com erros médios clássicos de zero ou erros médios...
Sei que essa é uma pergunta boba, pois conheço a teoria das variáveis instrumentais e a regressão em dois estágios. Ainda assim, nunca vi uma resposta clara para o seguinte: suponha que você tenha endogeneidade devido à variável não observada correlacionada com um dos regressores iniciais. A...
Considere regressão linear múltipla. Essa pergunta pode ser enganosamente simples, mas estou tentando entender intuitivamente por que, digamos, se eu tenho preditores X1 e X2, as interações entre esses preditores podem ser capturadas adequadamente por X1 * X2. Eu sei que os termos de interação são...
Na regressão logística, há Box-Tidwell, mas não sei nada disso na regressão linear. Uso plotagens residuais parciais para procurar isso, um recurso gráfico, mas gostaria de encontrar um teste formal (na honestidade, duvido que você possa fazer um teste formal disso, mas posso estar...
Estou tentando entender a intuição por trás do bootstrap selvagem. O que ele está realmente fazendo? Eu preciso ser capaz de entender o que está tentando fazer em comparação com uma regressão convencional. Meus dados têm heterocedasticidade e o método que utilizo faz 5000 repetições. Como ele...
Então, aqui estou estudando modelos lineares generalizados. Sei que essa pergunta é bastante ingênua e simples, mas não sei exatamente por que a função canônica do link é tão útil. Alguém poderia me fornecer uma intuição sobre esse
Estou um pouco confuso sobre quando você deve ou não adicionar termos polinomiais a um modelo de regressão linear múltipla. Eu sei que polinômios são usados para capturar a curvatura nos dados, mas sempre parece estar na forma de: y= x1+ x2+ x21+ x22+ x1x2+ cy=x1+x2+x12+x22+x1x2+cy = x_1 + x_2 +...
Esta questão resulta da discussão que se segue a uma pergunta anterior: Qual é a conexão entre mínimos quadrados parciais, regressão de classificação reduzida e regressão de componentes principais? Para a análise de componentes principais, um modelo probabilístico comumente usado é...
Meu professor de econometria usou o termo "identificado" na aula. Estamos considerando processos de geração de dados no formato que é uma variável aleatória e é um termo de erro aleatório. Nossas linhas de regressão assumem a forma deY=β0 0+β1 1X+ UY=β0+β1X+UY = \beta_0 + \beta_1 X +...
Na regressão linear do cume e do laço, um passo importante é escolher o parâmetro de ajuste lambda, geralmente eu uso a pesquisa de grade na escala de log de -6-> 4, funciona bem no cume, mas no laço, devo levar em conta a ordem da magnitude da saída y? por exemplo, se a saída y estiver na...
Abaixo está um gráfico de dispersão (limitado a US $ 10.000) representando a doação média que um projeto recebe versus a contagem de palavras do ensaio de solicitação de financiamento para todos os projetos representados nos dados de escolha de doadores abertos . Há um padrão perceptível, que...
Ao usar o comando drop1 em R para construção de modelo, é dito que a variável com o menor valor de AIC deve ser descartada. Qual poderia ser a razão para o mesmo? Eu sei que a AIC fala sobre perda de informações e um valor mais baixo da AIC é melhor, mas soltar uma variável com AIC baixa parece...
Se temos regressores estocásticos, estamos desenhando pares aleatórios para um monte de , a chamada amostra aleatória, de uma distribuição probabilística fixa, mas desconhecida . Teoricamente falando, a amostra aleatória nos permite aprender ou estimar alguns parâmetros da distribuição...