Perguntas com a marcação «data-mining»

10
Relação entre convolução em matemática e CNN

Li a explicação da convolução e a compreendi até certo ponto. Alguém pode me ajudar a entender como essa operação se relaciona à convolução nas redes neurais convolucionais? O filtro é uma função gque aplica

10
Como depurar a análise de dados?

Me deparei com o seguinte problema, que reconheço é bastante típico. Eu tenho alguns dados grandes, digamos, alguns milhões de linhas. Eu executo algumas análises não triviais, por exemplo, uma consulta SQL que consiste em várias subconsultas. Recebo algum resultado, afirmando, por exemplo, que a...

10
Melhores idiomas para computação científica [fechado]

Fechado . Esta questão precisa ser mais focada . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela se concentre apenas em um problema editando esta postagem . Fechado há 5 anos . Parece que a maioria...

10
Dados Comerciais da NASDAQ

Estou tentando encontrar dados de estoque para praticar, existe um bom recurso para isso? Encontrei o seguinte: ftp://emi.nasdaq.com/ITCH/, mas só tem o ano atual. Eu já tenho uma maneira de analisar o protocolo, mas gostaria de ter mais alguns dados para comparar. Ele não precisa estar no mesmo...

10
Detecção de outlier / anomalia escalável

Estou tentando configurar uma infraestrutura de big data usando Hadoop, Hive, Elastic Search (entre outros) e gostaria de executar alguns algoritmos em determinados conjuntos de dados. Eu gostaria que os algoritmos fossem escalonáveis, então isso exclui o uso de ferramentas como Weka, R ou RHadoop....

10
Como raspar página imdb?

Estou tentando aprender a raspagem da Web usando Python sozinho como parte de um esforço para aprender a análise de dados. Estou tentando raspar a página da Web do imdb cujo URL é o seguinte: http://www.imdb.com/search/title?sort=num_votes,desc&start=1&title_type=feature&year=1950,2012...

9
Mineração relacional de dados sem ILP

Eu tenho um grande conjunto de dados de um banco de dados relacional para o qual preciso criar um modelo de classificação. Normalmente, para essa situação, eu usaria a Programação Lógica Indutiva (ILP), mas devido a circunstâncias especiais, não posso fazer isso. A outra maneira de resolver isso...

8
Como construir um mecanismo de pesquisa textual?

Estou tendo uma string HTML e quero descobrir se uma palavra fornecida é relevante nessa string. A relevância pode ser medida com base na frequência do texto. Um exemplo para ilustrar meu problema: this is an awesome bike store bikes can be purchased online. the bikes we own rock. check out our...