Saya menganalisis jaringan sosial (bukan virtual) dan saya mengamati koneksi antara orang-orang. Jika seseorang memilih orang lain untuk dihubungkan secara acak, jumlah koneksi dalam sekelompok orang akan didistribusikan secara normal - setidaknya sesuai dengan buku yang sedang saya baca.
Bagaimana kita bisa tahu distribusinya adalah Gaussian (normal)? Ada distribusi lain seperti Poisson, Rice, Rayliegh, dll. Masalah dengan distribusi Gaussian secara teori adalah bahwa nilainya berubah dari ke (walaupun probabilitasnya mendekati nol) dan jumlah koneksi tidak dapat negatif.
Adakah yang tahu distribusi mana yang diharapkan jika masing-masing orang secara independen (secara acak) mengambil orang lain untuk dihubungkan?
Jawaban:
Bila ada orang dan jumlah koneksi yang dibuat oleh orang i , 1 ≤ i ≤ n , adalah X i , maka jumlah total koneksi adalah S n = Σ n i = 1 X i / 2 . Sekarang jika kita menganggap X i sebagai variabel acak, anggaplah mereka independen dan variansnya tidak "terlalu tidak setara" karena semakin banyak orang ditambahkan ke dalam campuran, maka Teorema Batas Pusat Lindeberg-Levy berlaku. Ini menegaskan bahwa fungsi distribusi kumulatifn i,1≤i≤n, Xi Sn=∑ni=1Xi/2 Xi dari jumlah standar yang menyatu dengan cdf dari distribusi normal. Itu berarti secara kasar bahwa histogram penjumlahan akan terlihat lebih dan lebih seperti Gaussian ("kurva lonceng") ketika tumbuh besar.n
Mari kita tinjau apa yang tidak dikatakan ini:
Ini tidak menyatakan bahwa distribusi selalu benar-benar normal. Tidak mungkin, karena alasan yang Anda tunjukkan.Sn
Itu tidak menyiratkan jumlah koneksi yang diharapkan konvergen. Bahkan, ia harus menyimpang (pergi hingga tak terbatas). Standarisasi adalah penyebarluasan dan pengubahan ukuran distribusi; jumlah penyelamatan tumbuh tanpa batas.
sumber
Jawabannya tergantung pada asumsi yang ingin Anda buat. Jaringan sosial terus berkembang dari waktu ke waktu dan karenanya bukan entitas statis. Oleh karena itu, Anda perlu membuat beberapa asumsi tentang bagaimana jaringan berkembang dari waktu ke waktu.
Jika seseorang memilih orang lain secara acak untuk terhubung maka pada akhirnya semua orang akan terhubung.
Namun, jaringan kehidupan nyata tidak berperilaku seperti ini. Orang berbeda dalam beberapa aspek.
Setiap saat seseorang memiliki ukuran jaringan tetap dan kemungkinan koneksi lain yang dibuat adalah fungsi dari ukuran jaringannya (ketika orang memperkenalkan orang lain, dll.).
Seseorang memiliki kecenderungan intrinsiknya sendiri untuk membentuk koneksi (karena beberapa introvert / exterovert dll).
Probabilitas ini berubah seiring waktu, konteks, dll. Saya tidak yakin ada jawaban langsung kecuali kita membuat beberapa asumsi tentang struktur jaringan (misalnya, kepadatan jaringan, bagaimana orang berperilaku dll).
sumber