Estou procurando conjuntos de dados de redes sociais (twitter, friendfeed, facebook, lastfm etc.) para tarefas de classificação, de preferência no formato arff.
Minhas pesquisas via UCI e Google não foram bem-sucedidas até agora ... alguma sugestão?
fonte
Achei isso: 476 milhões de tweets no Twitter (via @yarapavan ).
fonte
Nós selecionamos um conjunto de dados do Twitter para amigos de usuários em 2009 e depois em 2009. Você pode encontrar mais informações aqui: http://strict.dista.uninsubria.it/?p=364
fonte
Confira kaggle.com, eles têm alguns concursos sobre redes sociais e divulgam conjuntos de dados.
Além disso, o SNAP de Stanford é um ótimo recurso. E tem trabalhos de pesquisa para inicializar.
fonte
Gráfico social do Facebook, instalações de aplicativos e usuários, eventos e grupos do Last.fm em http://odysseas.calit2.uci.edu/research/
Dois conjuntos de dados (coletados de abril a maio de 2009) que contêm amostras representativas de ~ 1 milhão de usuários em todo o Facebook, com algumas propriedades anotadas: para cada usuário da amostra, estão incluídas a lista de amigos, a lista de amigos, as configurações de privacidade e a associação à rede. Um terceiro conjunto de dados (coletado em fevereiro de 2008) inclui um gráfico bipartido que representa as instalações de aplicativos pelos usuários do Facebook. Um quarto conjunto de dados com Usuários Ativos Diários e instalações de aplicativos por 6 meses (coletado em setembro de 2007 a fevereiro de 2008). Um quinto conjunto de dados que inclui uma amostra representativa dos usuários da Last.fm obtida usando a amostragem multigráfica (coletada em julho de 2010).
fonte
Um bom recurso para encontrar conjuntos de dados é:
/ r / conjuntos de dados no Reddit.
Uma rápida olhada nessa página revela essa fonte , que pode conter algo útil para você.
fonte
Este documento usa um conjunto de dados do Facebook que está disponível aqui. Aqui está a descrição dos autores:
fonte