Por que as pessoas usam técnicas de programação quadrática (como SMO) ao lidar com SVMs kernelizados? O que há de errado com a descida do gradiente? É impossível usar com kernels ou é muito lento (e por quê?). Aqui está um pouco mais de contexto: tentando entender um pouco melhor os SVMs, usei o...