Entendendo a projeção linear em "Os Elementos da Aprendizagem Estatística"

8

No livro "Os Elementos da Aprendizagem Estatística" no capítulo 2 ("Modelos lineares e mínimos quadrados; página no: 12"), está escrito que

No espaço de entrada / saída dimensional (p + 1), (X, Y) representa um hiperplano. Se a constante estiver incluída em X, o hiperplano inclui a origem e é um subespaço; caso contrário, é um conjunto afiado que corta o eixo Y no ponto (0, ).β

Não recebo a frase "se constante for ... (0, )". Por favor ajude? Eu acho que o hiperplano cortaria o eixo Y em (0, ) nos dois casos, está correto?βββ

A resposta abaixo ajudou um pouco, mas estou procurando uma resposta mais específica. Entendo que quando é incluído no , ele não contém a origem, mas como o conteria a origem? Não deveria depender do valor de ? Se a interceptação não for , não deverá conter origem, no meu entendimento?X ( X , Y ) β β 0 0 ( X , Y )1X(X,Y)ββ00(X,Y)

Abhinav Gupta
fonte
2
Quanto álgebra linear você fez? Você sabe o que são vetores? E quanto a espaços vetoriais, subespaços, ...?
Adrian
Tenho conhecimentos básicos de álgebra linear, vetor e espaços vetoriais.
Abhinav Gupta
1
en.wikipedia.org/wiki/Hyperplane tem um pouco sobre hiperplanos afins e hiperplanos vetor
Adrian
Thnaks! basta ler este artigo. Mas ainda não entendo como se pode dizer que o hiperplano inclui a origem se o contanto for incluído no X. Se isso estiver claro, entendo por que o hiperplano é um subespaço.
Abhinav Gupta
página nº: 12. Também editei a pergunta.
Abhinav Gupta

Respostas:

4

Incluir a constante 1no vetor de entrada é um truque comum para incluir um viés (pense na interceptação em Y), mas mantendo todos os termos da expressão simétricos: você pode escrever vez de todos os lugares.β 0 + β XβXβ0+βX

Se você fizer isso, é correto que o hiperplano inclua a origem, já que a origem é um vetor de valores e a multiplicação por fornece o valor .0 β 0Y=βX0β0

No entanto, seus vetores de entrada sempre terão o primeiro elemento igual a ; portanto, eles nunca conterão a origem e serão colocados em um hiperplano menor, que tem uma dimensão a menos.1

Você pode visualizar isso pensando em uma linha na sua folha de papel (2 dimensões). O hiperplano correspondente, se você incluir o viés seu vetor se tornará e seus coeficientes . Em 3 dimensões, este é um plano que passa da origem, que intercepta o plano produzindo a linha onde suas entradas podem ser colocadas.q X = [ x , x 0 = 1 ] β = [ m , q ] x 0 = 1Y=mx+qqX=[x,x0=1]β=[m,q]x0=1

giorgiosironi
fonte
Eu ainda não entendo direito. O livro diz "Se a constante é incluída em X, o hiperplano inclui a origem e é um subespaço", mas como você afirmou, "os vetores de entrada sempre terão o primeiro elemento = 1, portanto nunca conterão a origem. Então, como incluir a constante 1 incluem a origem como diz o livro?
Minyoung Kim
Também demorei algum tempo para vê-lo, mas essa resposta ajudou. Você precisa esquecer a restrição em para ver o subespaço / plano sobre o qual eles falam, incluindo a origem. Quando você adiciona a restrição obtém exatamente a mesma linha 2D projetada no plano . x 0 = 1 x 0 = 1x0x0=1x0=1
grll ​​16/04
0

Para ajudar você a entender isso, fiz uma visualização de um caso muito simples.

Vamos dizer que nós temos um problema dimensional (p = 1) para uma característica única (de entrada) de prever uma única variável de saída . Vamos imaginar que já encontramos uma interceptação e um coeficiente para nossa variável de entrada .X1Yβ0=5β1=2X1

Nosso modelo linear teria a seguinte aparência: .Y^=β0+β1×X1

Portanto, a representação óbvia seria um hiperplano (uma linha) no espaço dimensional (p + 1) neste caso (2d):

constante não incluída em x

Outra representação seria adicionar outra variável que levará à seguinte equação: .X0Y = β 0 × X 0 + β 1 × X 1Y^=β0×X0+β1×X1

Na prática, sabemos que será uma constante e igual a 1, mas vamos assumir que ainda não foi corrigido. Nesse caso, agora podemos plotar um gráfico 3d com um hiperplano da seguinte maneira:X0

constante incluída em x

Finalmente, como sabemos que apenas é possível, destaquei com uma linha tracejada vermelha a única projeção em funcionamento deste hiperplano que corresponde exatamente ao gráfico que tínhamos antes.X0=1

grll
fonte