Eu sei que é Polynomial Logistic Regression
possível aprender facilmente dados típicos como a seguinte imagem:
Fiquei pensando se os dois dados a seguir também podem ser aprendidos usando ou não.
Polynomial Logistic Regression
Acho que tenho que adicionar mais explicações. Assuma a primeira forma. Se adicionarmos recursos polinomiais extras para esta entrada 2D (como x1 ^ 2 ...), podemos tomar um limite de decisão que pode separar os dados. Suponha que eu escolha X1 ^ 2 + X2 ^ 2 = b. Isso pode separar os dados. Se eu adicionar recursos extras, obterá uma forma ondulada (talvez um círculo ondulado ou reticências onduladas), mas ele ainda não pode separar os dados do segundo gráfico, pode?
machine-learning
classification
meios de comunicação
fonte
fonte
Respostas:
Sim, em teoria, a extensão polinomial da regressão logística pode aproximar-se de qualquer limite arbitrário de classificação. Isso ocorre porque um polinômio pode aproximar qualquer função (pelo menos dos tipos úteis para problemas de classificação), e isso é comprovado pelo teorema de Stone-Weierstrass .
Se essa aproximação é prática para todas as formas de contorno é outra questão. Você pode procurar melhor outras funções básicas (por exemplo, séries de Fourier ou distância radial de pontos de exemplo) ou outras abordagens inteiramente (por exemplo, SVM) quando suspeitar de uma forma complexa de limite no espaço de recursos. O problema com o uso de polinômios de alta ordem é que o número de recursos polinomiais que você precisa usar aumenta exponencialmente com o grau do polinômio e o número de recursos originais.
Você pode criar um polinômio para classificar o XOR.5 - 10 x y pode ser um começo se você usar - 1 e 1 como entradas binárias, isso mapeia a entrada ( x , y) para produzir da seguinte maneira:
Passar isso para a função logística deve fornecer valores próximos o suficiente para 0 e 1.
Semelhante às suas duas áreas circulares, há uma curva simples de oito:
Ondea , b e c são constantes. Você pode obter duas áreas fechadas separadas definidas no seu classificador - em lados opostos doy eixo, escolhendo a , b e c adequadamente. Por exemplo, tentea = 1 , b = 0,05 , c = - 1 para obter uma função que se separa claramente em dois picos ao redor x = - 3 e x = 3 :
O enredo mostrado é de uma ferramenta on-line no academo.org e é parax2-y2- 0,05x4- 1 > 0 - a classe positiva mostrada como valor 1 no gráfico acima e normalmente é onde 11 +e- z> 0,5 em regressão logística ou apenas z> 0
Um otimizador encontrará os melhores valores, você só precisará usar1 ,x2,y2,x4 como seus termos de expansão (embora observe que esses termos específicos se limitam a corresponder à mesma forma básica refletida em todo o y eixo - na prática, você deseja ter vários termos até o polinômio de quarto grau para encontrar grupos disjuntos mais arbitrários em um classificador).
De fato, qualquer problema que você possa resolver com uma rede neural profunda - de qualquer profundidade - poderá resolver com uma estrutura plana usando regressão linear (para problemas de regressão) ou regressão logística (para problemas de classificação). É "apenas" uma questão de encontrar a expansão correta dos recursos. A diferença é que as redes neurais tentarão descobrir diretamente uma expansão de recursos em funcionamento, enquanto a engenharia de recursos usando polinômios ou qualquer outro esquema é um trabalho árduo e nem sempre é óbvio como começar: considere, por exemplo, como você pode criar aproximações polinomiais para quais sistemas neurais convolucionais redes fazem para imagens? Parece impossível. É provável que seja extremamente impraticável também. Mas existe.
fonte
|x|
não é permitido, pois é uma não linearidade diferente.