A regressão de cume pode ser expressa como que é o rótulo previsto , o identificar matriz, o objeto que está tentando encontrar um rótulo para e o matriz de objetos tal que:
Podemos fazer o kernel da seguinte maneira:
onde é a matriz das funções do kernel
e o vetor de coluna das funções do kernel
Questões:
(a) se houver mais objetos que dimensões, faz sentido não usar kernels? Por exemplo, seja uma matriz , em seguida, será e acabaremos invertendo uma matriz vez dos matriz teríamos que inverter se usássemos kernels. Isso significa que, se , não devemos usar kernels?X 50×3 X ′ X 3×33×350×50d≤n
(b) o kernel mais simples possível deve ser usado? Parece que os kernels na regressão de crista são usados para negar as influências da dimensionalidade e não para utilizar determinadas propriedades do espaço de recurso (diferentemente das máquinas de vetores de suporte). Embora os kernels possam alterar as distâncias entre os objetos, existem kernels populares frequentemente usados na regressão de crista?
(c) qual é a complexidade do tempo da regressão de crista e / ou regressão de crista do núcleo?
Respostas:
(a) O objetivo do uso de um kernel é resolver um problema de regressão não linear neste caso. Um bom kernel permitirá que você resolva problemas em um espaço de recurso possivelmente com dimensões infinitas. Porém, usar um kernel linear e fazer a regressão da crista do kernel no espaço duplo é o mesmo que resolver o problema no espaço primal , ou seja, não traz nenhuma vantagem (é muito mais lento à medida que o número de amostras cresce conforme você observou).K(x,y)=x⊤y
(b) Uma das opções mais populares é o kernel exponencial quadrado que é universal (veja ref abaixo). Existem muitos kernels, e cada um deles induzirá um produto interno diferente (e, portanto, métrico) ao seu espaço de recurso.K(x,y)=exp(−τ2||x−y||2)
(c) A implementação direta requer a solução de uma equação linear de tamanho , portanto é . Existem muitos métodos de aproximação mais rápidos, como a aproximação de Nyström. Esta é uma área de pesquisa ativa.O ( n 3 )n O(n3)
Referências:
fonte