Perguntas com a marcação «data-mining»

13
Até que ponto o auto-estudo me leva?

Nunca participei de um curso oficial ou estruturado de análise de dados ou aprendizado de máquina (além das ofertas on-line recentes) e aprendi a maior parte do que sei lendo e testando as coisas. Sei que estou longe de conseguir um emprego. Minha pergunta não é o que é melhor ( como essa pergunta...

13
Melhores maneiras de agregar e analisar dados

Tendo recentemente começado a me ensinar Machine Learning e Análise de Dados, estou me deparando com uma parede de tijolos sobre a necessidade de criar e consultar grandes conjuntos de dados. Gostaria de pegar os dados que agreguei na minha vida profissional e pessoal e analisá-los, mas não tenho...

12
A ideia de fazer com que os dados tenham média zero

Costumo ver pessoas que fazem com que uma dimensão / recurso de um conjunto de dados seja de média zero, removendo a média de todos os elementos. Mas eu nunca entendi por que fazer isso? Qual é o efeito de fazer isso como uma etapa de pré-processamento? Melhora o desempenho da classificação? Ajuda...

12
Diferenças entre PROC Mixed e lme / lmer em R - graus de liberdade

Nota: esta pergunta é um repost, pois minha pergunta anterior teve que ser excluída por razões legais. Ao comparar o PROC MIXED do SAS com a função lmedo nlmepacote no R, deparei-me com algumas diferenças bastante confusas. Mais especificamente, os graus de liberdade nos diferentes testes...

11
Tutorial prático do PCA com dados

Pesquisando na Internet o tutorial do PCA fornece milhares de resultados (até vídeos). Muitos dos tutoriais são muito bons. Mas não consigo encontrar nenhum exemplo prático em que o PCA é explicado usando alguns conjuntos de dados que posso usar para demonstração. Preciso de um tutorial que forneça...

11
Quanta informação você pode extrair de um nome?

Um nome: primeiro, possivelmente meio, e sobrenome. Estou curioso para saber quantas informações você pode extrair de um nome, usando conjuntos de dados disponíveis ao público. Eu sei que você pode obter o seguinte com qualquer probabilidade entre baixa e alta (dependendo da entrada) usando os...