Estatísticas e Big Data

10
k-significa vs k-significa ++

Até onde eu sei, o k-means escolhe os centros iniciais aleatoriamente. Como eles são baseados em pura sorte, eles podem ser muito mal selecionados. O algoritmo K-means ++ tenta resolver esse problema, espalhando os centros iniciais uniformemente. Os dois algoritmos garantem os mesmos resultados?...

10
Definindo a dependência da cauda

Eu tenho tentado encontrar uma definição simples e concisa do que é a dependência da cauda. Alguém poderia compartilhar o que eles acreditam que é. Em segundo lugar, se eu plotar simulações usando diferentes cópulas em um gráfico, como saberia quais exibem dependência de...