Perguntas com a marcação «clustering»

16
Pressupostos da análise de cluster

Desculpas pela pergunta rudimentar, sou novo nesta forma de análise e tenho uma compreensão muito limitada dos princípios até agora. Eu estava pensando se muitas das suposições paramétricas para testes multivariados / univariados se aplicam à análise de cluster? Muitas das fontes de informação que...

16
Agrupando dados 1D

Eu tenho um conjunto de dados, quero criar clusters nesses dados com base em apenas uma variável (não há valores ausentes). Eu quero criar 3 clusters com base nessa variável. Qual algoritmo de clustering usar, k-means, EM, DBSCAN etc.? Minha principal pergunta é: em que circunstâncias devo usar...

15
Qual é a intuição por trás de amostras intercambiáveis ​​sob a hipótese nula?

Os testes de permutação (também chamados de teste de randomização, teste de re-randomização ou teste exato) são muito úteis e úteis quando a suposição de distribuição normal exigida por, por exemplo, t-testnão é atendida e quando a transformação dos valores pela classificação do teste...

15
Como plotar a saída de dados do clustering?

Tentei agrupar um conjunto de dados (um conjunto de marcas) e obtive 2 clusters. Eu gostaria de representá-lo graficamente. Um pouco confuso sobre a representação, já que não tenho as coordenadas (x, y). Também procurando pela função MATLAB / Python para fazer isso. EDITAR Acho que a publicação...

15
A precisão da máquina de aumento de gradiente diminui à medida que o número de iterações aumenta

Estou experimentando o algoritmo da máquina de aumento de gradiente através do caretpacote em R. Usando um pequeno conjunto de dados de admissões de faculdade, executei o seguinte código: library(caret) ### Load admissions dataset. ### mydata <-

15
Como ajustar o modelo de mistura para agrupamento

Eu tenho duas variáveis ​​- X e Y e preciso tornar o cluster máximo (e ideal) = 5. Vamos traçar o gráfico ideal de variáveis ​​como a seguir: Eu gostaria de fazer 5 grupos disso. Algo assim: Então eu acho que esse é um modelo de mistura com 5 clusters. Cada cluster tem um ponto central e um...

15
Detecção de séries temporais e anomalias

Gostaria de configurar um algoritmo para detectar uma anomalia em séries temporais, e pretendo usar o cluster para isso. Por que devo usar uma matriz de distância para agrupar e não os dados brutos de séries temporais ?, Para a detecção da anomalia, usarei o cluster baseado em densidade, um...

15
Como calcular a pureza?

Na análise de cluster, como calculamos a pureza? Qual é a equação? Não estou procurando um código para fazer isso por mim. Seja cluster ke classe j.c jωkωk\omega_kcjcjc_j Então a pureza é praticamente precisa? parece que estavam somando a quantidade de classe verdadeiramente classificada por...

15
Qual método de comparação múltipla usar para um modelo mais antigo: lsmeans ou glht?

Estou analisando um conjunto de dados usando um modelo de efeitos mistos com um efeito fixo (condição) e dois efeitos aleatórios (participante devido ao design do sujeito e ao par). O modelo foi gerado com o lme4pacote: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Em...

14
k-significa vs k-mediana?

Eu sei que existe algoritmo de agrupamento k-means e mediana k. Um que usa a média como o centro do cluster e o outro usa a mediana. Minha pergunta é: quando / onde usar