Sou iniciante em Machine Learning. No SVM, o hiperplano de separação é definido como . Por que dizemos vetor w ortogonal ao hiperplano de separação?
machine-learning
svm
Chong Zheng
fonte
fonte
Respostas:
Geometricamente, o vetor w é direcionado ortogonalmente à linha definida por . Isto pode ser entendido como o seguinte:WTx = b
Primeiro, pegue . Agora está claro que todos os vetores, x , com produto interno em fuga com w satisfazem esta equação, ou seja, todos os vetores ortogonais w satisfazem essa equação.b = 0 x W
Agora traduza o hiperplano para longe da origem sobre um vetor a. A equação para o plano agora se torna: , ou seja, achamos que para o deslocamento b = a T w , que é a projeção do vetor a no vetor w .( x - a )Tw = 0 b = aTW uma W
Sem perda de generalidade, podemos assim escolher uma perpendicular ao plano, caso em que o comprimento que representa a distância ortogonal mais curta entre a origem e o hiperplano.| | a | | = | b | / | | w | |
Portanto, o vetor é ortogonal ao hiperplano de separação.W
fonte
A razão pela qual é normal para o hiperplano é porque definimos que é dessa maneira:W
Suponha que tenhamos um (hiper) plano no espaço 3d. Seja um ponto neste plano, ou seja, P 0 = x 0 , y 0 , z 0 . Portanto, o vetor da origem ( 0 , 0 , 0 ) até este ponto é apenas < x 0 , y 0 , z 0 > . Suponha que tenhamos um ponto arbitrário P ( x , y , z ) no plano. O vetor que une PP0 0 P0 0= x0 0, y0 0, z0 0 ( 0 , 0 , 0 ) < x0 0, y0 0, z0 0> P( x , y, z) P e é então dado por:
→ P - → P 0 = < x - x 0 , y - y 0 , z - z 0 >
Observe que esse vetor está no plano.P0 0
Agora vamos n ser o (ortogonal) vector normal ao plano. Portanto: n ∙ ( → P - → P 0 ) = 0 Assim: n ∙ → P - N ∙n^
fonte
Seja o limite de decisão definido comoWTx + b = 0 . Considere os pontos xuma e xb , que estão no limite da decisão. Isso nos dá duas equações:
Subtraindo estas duas equações nos dáWT. ( xuma- xb) = 0 . Observe que o vetor xuma- xb fica no limite de decisão e é direcionado a partir de xb xuma WT. ( xuma- xb) WT xuma- xb
fonte
Usando a definição algébrica de um vetor ortogonal a um hiperplano:
fonte