Saya mencari dataset jaringan sosial (twitter, friendfeed, facebook, lastfm, dll.) Untuk tugas klasifikasi, lebih disukai dalam format arff.
Pencarian saya melalui UCI dan Google sejauh ini tidak berhasil ... ada saran?
classification
dataset
Tanzeem
sumber
sumber
Baru menemukan ini: 476 juta tweet Twitter (via @yarapavan )
sumber
Kami telah membuat dataset Twitter untuk teman pengguna pada tahun 2009 dan kemudian pada tahun 2009. Anda dapat menemukan informasi lebih lanjut di sini: http://strict.dista.uninsubria.it/?p=364
sumber
Lihat kaggle.com, mereka memiliki beberapa kontes tentang jejaring sosial dan mereka membagikan set data.
Juga, Stanford's SNAP adalah sumber yang bagus. Dan memiliki karya penelitian untuk boot.
sumber
Grafik sosial Facebook, instalasi aplikasi dan pengguna Last.fm, acara, grup di http://odysseas.calit2.uci.edu/research/
Dua kumpulan data (dikumpulkan April-Mei 2009) yang berisi sampel representatif dari ~ 1 juta pengguna di seluruh Facebook, dengan beberapa properti beranotasi: untuk setiap pengguna sampel, daftar teman, pengaturan privasi, dan keanggotaan jaringan disertakan. Dataset ketiga (dikumpulkan Februari 2008) mencakup grafik bipartit yang mewakili instalasi aplikasi oleh pengguna Facebook. Dataset keempat dengan Pengguna Aktif Harian dan instalasi aplikasi selama 6 bulan (dikumpulkan September 2007-Februari 2008). Dataset kelima yang mencakup sampel representatif dari pengguna Last.fm yang diperoleh menggunakan pengambilan sampel multigraf (dikumpulkan Juli 2010).
sumber
Sumber daya yang baik untuk menemukan kumpulan data adalah:
/ r / dataset di Reddit.
Sekilas pada halaman itu mengungkapkan sumber ini , yang mungkin mengandung sesuatu yang berguna untuk Anda.
sumber
Makalah ini menggunakan dataset Facebook yang tersedia di sini. Berikut ini deskripsi dari penulis:
sumber