Temos muitas boas discussões sobre a separação perfeita na regressão logística. Por exemplo, a regressão logística em R resultou em perfeita separação (fenômeno de Hauck-Donner). O que agora? e o modelo de regressão logística não converge .
Pessoalmente, ainda acho que não é intuitivo por que será um problema e por que a adição de regularização o corrigirá. Fiz algumas animações e acho que será útil. Então, poste sua pergunta e responda sozinha para compartilhar com a comunidade.
Respostas:
Uma demonstração 2D com dados de brinquedos será usada para explicar o que estava acontecendo para uma separação perfeita na regressão logística com e sem regularização. Os experimentos começaram com um conjunto de dados sobrepostos e gradualmente separamos duas classes. O contorno da função objetivo e o valor ótimo (perda logística) serão mostrados na sub-figura à direita. Os dados e o limite de decisão linear são plotados na sub-figura esquerda.
Primeiro, tentamos a regressão logística sem regularização.
Em seguida, tentamos a regressão logística com regularização de L2 (L1 é semelhante).
Com a mesma configuração, adicionar uma regularização L2 muito pequena alterará as alterações da função objetivo em relação à separação dos dados.
Nesse caso, sempre teremos o objetivo "convexo". Não importa quanta separação os dados tenham.
código (eu também uso o mesmo código para esta resposta: Métodos de regularização para regressão logística )
fonte