A regularização líquida elástica é sempre preferida à Lasso & Ridge, pois parece resolver as desvantagens desses métodos? Qual é a intuição e qual é a matemática por trás da rede
A regularização líquida elástica é sempre preferida à Lasso & Ridge, pois parece resolver as desvantagens desses métodos? Qual é a intuição e qual é a matemática por trás da rede
Caro pessoal, notei algo estranho que não sei explicar, não é? Em resumo: a abordagem manual para calcular um intervalo de confiança em um modelo de regressão logística e a função R confint()fornecem resultados diferentes. Eu tenho passado pela regressão logística aplicada de Hosmer & Lemeshow...
Erro quadrático médio da raiz soma residual de quadrados erro padrão residual erro quadrático médio erro de teste Eu achava que costumava entender esses termos, mas quanto mais eu faço problemas estatísticos, mais me confundei com o que acho. Gostaria de alguma garantia e um exemplo...
X e Y não estão correlacionados (-.01); no entanto, quando coloco X em uma regressão múltipla prevendo Y, ao lado de três (A, B, C) outras variáveis (relacionadas), X e duas outras variáveis (A, B) são preditores significativos de Y. Observe que as outras duas ( A, B) as variáveis estão...
Por que a regressão logística se torna instável quando as classes são bem separadas? O que significam classes bem separadas? Eu realmente aprecio se alguém puder explicar com um
Digamos que eu esteja estudando como os narcisos respondem a várias condições do solo. Eu coletei dados sobre o pH do solo versus a altura madura do narciso. Estou esperando um relacionamento linear, então continuo executando uma regressão linear. No entanto, quando eu comecei meu estudo, eu não...
Considere a figura a seguir dos Modelos Lineares de Faraway com R (2005, p. 59). O primeiro gráfico parece indicar que os resíduos e os valores ajustados não estão correlacionados, pois deveriam estar em um modelo linear homoscedástico com erros normalmente distribuídos. Portanto, as segunda e...
Por que um procedimento de validação cruzada supera o problema de sobreajustar um
Estou curioso sobre procedimentos repetitivos que podem ser usados para descobrir a forma funcional da função y = f(A, B, C) + error_termonde minha única entrada é um conjunto de observações ( y, A, Be C). Observe que a forma funcional de fé desconhecida. Considere o seguinte conjunto de...
Alguém pode recomendar uma boa exposição da teoria por trás da regressão de mínimos quadrados parciais (disponível on-line) para alguém que entende SVD e PCA? Procurei muitas fontes on-line e não encontrei nada que tivesse a combinação certa de rigor e acessibilidade. Analisei The Elements of...
Entendo que, para determinados conjuntos de dados, como a votação, ele tem um desempenho melhor. Por que a regressão de Poisson é usada sobre regressão linear comum ou regressão logística? Qual é a motivação matemática para
Sou engenheiro de software aprendendo aprendizado de máquina, principalmente através dos cursos de Andrew Ng . Enquanto estudava regressão linear com regularização , encontrei termos que são confusos: Regressão com regularização L1 ou regularização L2 LAÇO Regressão de Ridge Então, minhas...
Estou tentando entender a origem das bandas de confiança em forma de curva associadas a uma regressão linear OLS e como ela se relaciona com os intervalos de confiança dos parâmetros de regressão (inclinação e interceptação), por exemplo (usando R): require(visreg) fit <- lm(Ozone ~...
Imagino que quanto maior o coeficiente de uma variável, maior a capacidade do modelo de "girar" nessa dimensão, proporcionando uma oportunidade maior de ajustar o ruído. Embora eu ache que tenho um senso razoável da relação entre a variação no modelo e os coeficientes grandes, não tenho uma noção...
Como os métodos de regularização de cume, LASSO e elasticnet se comparam? Quais são as respectivas vantagens e desvantagens? Qualquer bom artigo técnico ou anotações de aula também serão apreciados.
A estatística de teste para o teste Hosmer-Lemeshow (HLT) para qualidade de ajuste (GOF) de um modelo de regressão logística é definida da seguinte forma: A amostra é então dividida em deciles , D_1, D_2, \ dots, D_ {d} , por decil, um calcula as seguintes
Regularização de Tikhonov e regressão de crista são termos frequentemente usados como se fossem idênticos. É possível especificar exatamente qual é a
Estou um pouco confuso com uma palestra sobre regressão linear dada por Andrew Ng no Coursera sobre aprendizado de máquina. Lá, ele deu uma função de custo que minimiza a soma dos quadrados como: 12m∑i=1m(hθ(X(i))−Y(i))212m∑i=1m(hθ(X(i))−Y(i))2 \frac{1}{2m} \sum _{i=1}^m...
Um artigo "Computando com precisão a variação de execução" em http://www.johndcook.com/standard_deviation.html mostra como calcular a média de execução, a variação e os desvios padrão. Existem algoritmos nos quais os parâmetros de um modelo de regressão linear ou logística podem ser similarmente...
Ao fazer a regressão, por exemplo, dois hiper parâmetros a serem escolhidos geralmente são a capacidade da função (por exemplo, o maior expoente de um polinômio) e a quantidade de regularização. O que me deixa confuso é por que não escolher uma função de baixa capacidade e depois ignorar qualquer...