Perguntas com a marcação «data-mining»

25
LSA vs. PCA (agrupamento de documentos)

Estou investigando várias técnicas usadas no agrupamento de documentos e gostaria de esclarecer algumas dúvidas sobre o PCA (análise de componentes principais) e LSA (análise semântica latente). Primeira coisa - quais são as diferenças entre eles? Eu sei que no PCA, a decomposição de SVD é...

21
Primeiro passo para big data (

Suponha que você esteja analisando um enorme conjunto de dados na ordem de bilhões de observações por dia, em que cada observação possui algumas milhares de variáveis ​​numéricas e categoriais esparsas e possivelmente redundantes. Digamos que exista um problema de regressão, um problema de...