Livros ou artigos recomendados como introdução à Análise de Cluster?

12

Estou trabalhando em um pequeno corpus (200M) de texto, que quero explorar com algumas análises de cluster. Quais livros ou artigos sobre esse assunto você recomendaria?

miku
fonte

Respostas:

6

Pode valer a pena olhar para os livros de MW Berry:

  1. Pesquisa de mineração de texto I: agrupamento, classificação e recuperação (2003)
  2. Pesquisa de Mineração de Texto II: Clustering, Classificação e Recuperação (2008)

Eles consistem em séries de papéis aplicados e de revisão. O mais recente parece estar disponível em PDF no seguinte endereço: http://bit.ly/deNeiy .

Aqui estão alguns links relacionados à CA aplicados à mineração de texto:

Você também pode olhar para a Análise Semântica Latente , mas veja minha resposta: Trabalhando com um problema de cluster .

Chl
fonte
5

Localizando grupos nos dados. Uma Introdução à Análise de Cluster dos professores Leonard Kaufman e Peter J. Rousseeuw.

Estou lendo o livro e o acho muito útil porque:

  • Como declarado pelos autores no prefácio:

Nosso objetivo era escrever um livro aplicado para o usuário em geral. Queríamos disponibilizar a análise de cluster para pessoas que não possuem necessariamente uma sólida formação matemática ou estatística.

  • Ele fornece conteúdo teórico para entender as funções disponíveis no Rpacote Cluster .

  • Os capítulos podem ser lidos individualmente, de acordo com o método de interesse do cluster.
    A exceção é o capítulo 3, que se baseia no capítulo 2

Os capítulos do livro são:

  1. Introdução
  2. Particionando em torno de medóides (Programa PAM).
  3. Agrupando aplicativos grandes (programa CLARA).
  4. Análise Fuzzy (Programa ENGRAÇADO).
  5. Aninhamento Aglomerado (Programa AGNES).
  6. Análise Divisiva (Programa DIANA).
  7. Análise Monotética (Programa MONA).

Referências:

Kaufman, L. & Rousseeuw, PJ (2005). Localizando grupos nos dados. Uma introdução à análise de cluster (p. 342). John Wiley & Sons Inc. Empresas

Maechler, M. (2013). Análise de Cluster Extended Rousseeuw et al. CRAN.

Andre Silva
fonte
Este livro realmente oferece uma boa visão geral do campo. Ele se concentra em alguns algoritmos / métodos (por exemplo, a silhueta bem conhecida, que por acaso foi projetada por um dos autores do livro) e os abrange extensivamente. Ele também vem com algum código, mas no estilo 1990. FYI: índice completo .
Franck Dernoncourt 26/11
2

A Análise de Cluster, de Brian S. Everitt, é um bom tratamento aplicado ao comprimento de livro da Análise de Cluster.

Brett
fonte
1

Outro livro aprofundado que vale a pena examinar: Handbook of Cluster Analysis, de Hennig et al. (2015)

tbeck
fonte