Gostaria de saber as diferenças entre Regressão Logística Aleatória (RLR) e Regressão Logística Simples (LR), portanto, estou lendo um artigo "Seleção de Estabilidade" de Meinshausen, et al. ; no entanto, eu não entendo o que é RLR e quais são as diferenças entre RLR e LR.
Alguém poderia apontar o que eu deveria ler para entender a RLR? Ou existe um exemplo simples para começar?
machine-learning
logistic
Hendra Bunyamin
fonte
fonte
Respostas:
Você pode querer verificar esta referência . O aprendizado do Sci-kit implementa regressão logística aleatória e o método é descrito lá.
Mas, para responder à sua pergunta, os dois métodos diferem amplamente em seus objetivos. A regressão logística é sobre o ajuste de um modelo e RLR é sobre a localização das variáveis que entram no modelo.
A regressão logística de baunilha é um modelo linear generalizado. Para uma resposta binária, postulamos que as chances de log da probabilidade de resposta são uma função linear de vários preditores. Os coeficientes dos preditores são estimados usando a máxima verossimilhança e a inferência sobre os parâmetros é então baseada nas grandes propriedades da amostra do modelo. Para melhores resultados, normalmente assumimos que o modelo é bastante simples e bem compreendido. Sabemos quais variáveis independentes afetam a resposta. Queremos estimar os parâmetros do modelo.
Obviamente, na prática, nem sempre sabemos quais variáveis devem ser incluídas no modelo. Isso é especialmente verdadeiro em situações de aprendizado de máquina nas quais o número de variáveis explicativas em potencial é enorme e seus valores são escassos.
Ao longo dos anos, muitas pessoas tentaram usar as técnicas de ajuste estatístico de modelos para fins de seleção de variáveis (leia-se "característica"). No aumento do nível de confiabilidade:
fonte