Perguntas com a marcação «data-mining»

A mineração de dados usa métodos da inteligência artificial em um contexto de banco de dados para descobrir padrões anteriormente desconhecidos. Como tal, os métodos geralmente não são supervisionados. Está intimamente relacionado, mas não é idêntico ao aprendizado de máquina. As principais tarefas da mineração de dados são análise de cluster, detecção de outlier e mineração de regras de associação.

131
Kappa de Cohen em inglês comum

Estou lendo um livro de mineração de dados e ele mencionou a estatística Kappa como um meio de avaliar o desempenho de previsão dos classificadores. No entanto, eu simplesmente não consigo entender isso. Também verifiquei a Wikipedia, mas também não ajudou:

71
Gere uma variável aleatória com uma correlação definida para uma (s) variável (s) existente (s)

Para um estudo de simulação, eu tenho que gerar variáveis ​​aleatórias que mostram uma correlação pré-definida (população) com uma variável existente YYY. Examinei os Rpacotes copulae CDVineque podem produzir distribuições multivariadas aleatórias com uma determinada estrutura de dependência. No...

36
Medida de elevação na mineração de dados

Pesquisei muitos sites para saber exatamente o que o elevador fará? Os resultados que encontrei foram sobre o uso em aplicativos e não em si. Eu sei sobre a função de suporte e confiança. Na Wikipedia, na mineração de dados, o lift é uma medida do desempenho de um modelo na previsão ou...

34
Por que existe uma diferença entre calcular manualmente um intervalo de confiança de 95% da regressão logística e usar a função confint () em R?

Caro pessoal, notei algo estranho que não sei explicar, não é? Em resumo: a abordagem manual para calcular um intervalo de confiança em um modelo de regressão logística e a função R confint()fornecem resultados diferentes. Eu tenho passado pela regressão logística aplicada de Hosmer & Lemeshow...