Perguntas com a marcação «clustering»

10
Como agrupar variáveis ​​longitudinais?

Eu tenho um monte de variáveis ​​que contêm dados longitudinais do dia 0 ao dia 7. Estou procurando uma abordagem de cluster apropriada que possa agrupar essas variáveis ​​longitudinais (não casos) em grupos diferentes. Tentei analisar esses dados separadamente por tempo, mas o resultado foi...

10
Distribuições de cluster

Eu tenho várias distribuições (10 distribuições na figura abaixo). De fato, estes são histogramas: existem 70 valores no eixo x, que são os tamanhos de algumas partículas em uma solução e para cada valor de x o valor correspondente de y é a proporção de partículas cujo tamanho é em torno do valor...

10
Variável categórica de regressão linear R valor "oculto"

Este é apenas um exemplo que encontrei várias vezes, portanto não tenho dados de amostra. Executando um modelo de regressão linear em R: a.lm = lm(Y ~ x1 + x2) x1é uma variável contínua. x2é categórico e possui três valores, por exemplo, "Baixo", "Médio" e "Alto". No entanto, a saída fornecida...

10
Detectando clusters de códigos-fonte "semelhantes"

Suponha que eu tenho 400 estudantes (que estão em uma grande universidade) que precisam fazer um projeto de ciência da computação e que precisam trabalhar sozinhos (sem grupo de estudantes). Um exemplo de projeto poderia ser "implementando um algoritmo de transformação rápida de fourier no fortran"...

10
Por que Anova () e drop1 () forneceram respostas diferentes para os GLMMs?

Eu tenho um GLMM do formulário: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), obtenho resultados diferentes dos que utilizo Anova(model, type="III")na embalagem do carro ou summary(model). Estes dois...

10
O que aconteceu com a Fuzzy Logic?

A lógica difusa parecia uma área ativa de pesquisa em aprendizado de máquina e mineração de dados quando eu estava na faculdade (início dos anos 2000). Os sistemas de inferência difusa, c-meios difusos, versões difusas das várias redes neurais e arquiteturas de máquinas de vetores de suporte...

10
Quais são os métodos estatísticos que posso usar para encontrar combinações populares ou comuns de variáveis ​​categóricas?

Estou fazendo um estudo sobre o uso de drogas múltiplas. Eu tenho um conjunto de dados de 400 viciados em drogas, cada um declarando as drogas que abusam. Existem mais de 10 medicamentos e, portanto, existem grandes combinações possíveis. Recodifiquei a maioria das drogas que eles consomem em...

10
Como obter um intervalo de confiança na mudança do quadrado da população

Para um exemplo simples, assuma que existem dois modelos de regressão linear Modelo 1 tem três preditores, x1a, x2b, ex2c O modelo 2 possui três preditores do modelo 1 e dois preditores adicionais x2aex2b Existe uma equação de regressão populacional em que a variação populacional explicada é...

10
Como devo interpretar a estatística GAP?

Usei a estatística GAP para estimar k clusters em R. No entanto, não tenho certeza se a interpreto bem. A partir da trama acima, presumo que devo usar 3 clusters. No segundo lote, devo escolher 6 grupos. É uma interpretação correta da estatística GAP? Eu ficaria grato por qualquer...