Estatísticas e Big Data

61
Onde cortar um dendrograma?

O cluster hierárquico pode ser representado por um dendograma. Cortar um dendrograma em um determinado nível fornece um conjunto de clusters. Cortar em outro nível fornece outro conjunto de clusters. Como você escolheria onde cortar o dendrograma? Existe algo que poderíamos considerar um ponto...

61
Razão de verossimilhança vs fator de Bayes

Sou bastante evangelístico no que diz respeito ao uso de razões de probabilidade para representar a evidência objetiva a favor / contra um determinado fenômeno. No entanto, aprendi recentemente que o fator Bayes desempenha uma função semelhante no contexto dos métodos bayesianos (isto é, o prior...

61
Por que o Jeffreys prior é útil?

Entendo que o prior de Jeffreys é invariável sob uma parametrização. No entanto, o que não entendo é por que essa propriedade é desejada. Por que você não gostaria que o anterior fosse alterado sob uma alteração de

61
Qual é a relação entre o cluster de k-means e o PCA?

É uma prática comum aplicar o PCA (análise de componentes principais) antes de um algoritmo de armazenamento em cluster (como k-means). Acredita-se que melhora os resultados do agrupamento na prática (redução de ruído). No entanto, estou interessado em um estudo comparativo e aprofundado da...