Treinei um modelo de regressão linear, usando um conjunto de variáveis / recursos. E o modelo tem um bom desempenho. No entanto, percebi que não há variável com uma boa correlação com a variável prevista. Como isso é
Treinei um modelo de regressão linear, usando um conjunto de variáveis / recursos. E o modelo tem um bom desempenho. No entanto, percebi que não há variável com uma boa correlação com a variável prevista. Como isso é
Estima-se que os estimadores de regressão penalizados, como LASSO e cume, correspondam aos estimadores bayesianos com certos antecedentes. Eu acho (como eu não sei o suficiente sobre estatísticas bayesianas) que, para um parâmetro de ajuste fixo, existe um prévio concreto correspondente. Agora, um...
Eu li inúmeras publicações neste site que são incrivelmente contra o uso de seleção gradual de variáveis usando qualquer tipo de critério, seja com base em valores-p, AIC, BIC, etc. Entendo por que esses procedimentos são, em geral, muito ruins para a seleção de variáveis. o post provavelmente...
Eu tenho uma variável numérica que resulta não significativa em um modelo de regressão logística multivariada. No entanto, quando eu o categorizo em grupos, de repente se torna significativo. Isso é muito contra-intuitivo para mim: ao categorizar uma variável, fornecemos algumas...
Alguém conhece um bom artigo de revisão para a literatura estatística sobre regressão não linear? Estou interessado principalmente em resultados de consistência e assintóticos. De particular interesse é o modelo yeu t= m ( xeu t, θ ) + ϵeu t,yEut=m(xEut,θ)+ϵEut,y_{it} = m(x_{it},\theta) +...
Em Regressão logística, é necessário estar tão preocupado com a multicolinearidade quanto na regressão OLS direta? Por exemplo, com uma regressão logística, onde existe multicolinearidade, você precisa ser cauteloso (como faria na regressão OLS) ao deduzir inferência dos coeficientes Beta? Para...
Como devo definir uma fórmula de modelo em R, quando uma (ou mais) restrições lineares exatas que vinculam os coeficientes está disponível. Como exemplo, digamos que você saiba que b1 = 2 * b0 em um modelo de regressão linear
Como a modelagem de regressão geralmente é mais "arte" do que ciência, muitas vezes me pego testando muitas iterações de uma estrutura de regressão. Quais são algumas maneiras eficientes de resumir as informações dessas várias execuções de modelo na tentativa de encontrar o "melhor" modelo? Uma...
Estou tentando implementar uma análise de "ponto de mudança" ou uma regressão multifásica usando nls()em R. Aqui estão alguns dados falsos que eu criei . A fórmula que eu quero usar para ajustar os dados é: y= β0 0+ β1x + β2max ( 0 , x - δ)y=β0 0+β1x+β2max(0 0,x-δ)y = \beta_0 + \beta_1x +...
Em geral, padronizo minhas variáveis independentes em regressões, a fim de comparar adequadamente os coeficientes (dessa forma, eles têm as mesmas unidades: desvios-padrão). No entanto, com dados longitudinais / em painel, não tenho certeza de como devo padronizar meus dados, especialmente se...
Alguém poderia me dizer o que o termo 'persistência' significa na análise de séries temporais? É sobre econometria e regressão
Eu tenho um modelo linear clássico, com 5 possíveis regressores. Eles não estão correlacionados entre si e têm uma correlação bastante baixa com a resposta. Cheguei a um modelo em que três dos regressores têm coeficientes significativos para sua estatística t (p <0,05). A adição de uma ou das...
Eu sou completamente novo nisso, então espero que você me perdoe se a pergunta for ingênua. (Contexto: estou aprendendo econometria com o livro "Econometria e Métodos" de Davidson & MacKinnon , e eles parecem não explicar isso; também observei o livro de otimização de Luenberger que lida com...
Considere regressão linear com alguma regularização: por exemplo, encontre que minimize | | A x - b | | 2 + λ | | x |xxx||Ax−b||2+λ||x||1||Ax−b||2+λ||x||1||Ax - b||^2+\lambda||x||_1 Normalmente, as colunas de A são padronizadas para ter média zero e norma de unidade, enquanto é centralizado para...
Eu tenho dados de contagem (análise de demanda / oferta com número de clientes, dependendo - possivelmente - de muitos fatores). Tentei uma regressão linear com erros normais, mas meu gráfico QQ não é realmente bom. Tentei uma transformação de log da resposta: mais uma vez, QQ-plot ruim. Então...
Isso é algo que estou vendo feito como uma espécie de método ad-hoc e me parece muito suspeito, mas talvez esteja faltando alguma coisa. Já vi isso em regressão múltipla, mas vamos simplificar: yEu= β0 0+ β1xEu+ εEuyEu=β0 0+β1xEu+εEu y_{i} = \beta_{0} + \beta_{1} x_{i} + \varepsilon_{i} Agora...
Este link da Wikipedia lista uma série de técnicas para detectar a heterocedasticidade dos resíduos de OLS. Eu gostaria de aprender qual técnica prática é mais eficiente na detecção de regiões afetadas pela heterocedasticidade. Por exemplo, aqui a região central do gráfico OLS 'Residuals vs...
Eu sempre vi o conselho para verificar se um ajuste do modelo de Poisson está ou não disperso em excesso, envolvendo a divisão do desvio residual pelos graus de liberdade. A proporção resultante deve ser "aproximadamente 1". A questão é de qual faixa estamos falando para "aproximado" - qual é a...
O que seria um número mínimo "razoável" de observações para procurar uma tendência ao longo do tempo com uma regressão linear? que tal ajustar um modelo quadrático? Trabalho com índices compostos de desigualdade em saúde (SII, RII) e tenho apenas 4 vagas da pesquisa, portanto, 4 pontos...
Não tenho certeza se normalizar é a palavra correta a ser usada aqui, mas tentarei ilustrar o que estou tentando perguntar. O estimador usado aqui é de mínimos quadrados. Suponha que você tem y=β0+β1x1y=β0+β1x1y=\beta_0+\beta_1x_1 , você pode centralizá-lo em torno da média de...