A Análise de Componentes Principais (PCA) é usada para reduzir dados n-dimensionais para dados k-dimensionais para acelerar as coisas no aprendizado de máquina. Após a aplicação do PCA, pode-se verificar quanto da variação do conjunto de dados original permanece no conjunto de dados resultante. Um objetivo comum é manter a variação entre 90% e 99%.
Minha pergunta é: é uma boa prática tentar diferentes valores do parâmetro k (tamanho da dimensão do conjunto de dados resultante) e depois verificar os resultados dos modelos resultantes em relação a alguns conjuntos de dados de validação cruzada da mesma maneira que fazemos para escolher bons valores de outros hiperparâmetros como lambdas de regularização e limiares?
fonte