Bagaimana mungkin jumlah koneksi menjadi Gaussian jika tidak bisa negatif?

14

Saya menganalisis jaringan sosial (bukan virtual) dan saya mengamati koneksi antara orang-orang. Jika seseorang memilih orang lain untuk dihubungkan secara acak, jumlah koneksi dalam sekelompok orang akan didistribusikan secara normal - setidaknya sesuai dengan buku yang sedang saya baca.

Bagaimana kita bisa tahu distribusinya adalah Gaussian (normal)? Ada distribusi lain seperti Poisson, Rice, Rayliegh, dll. Masalah dengan distribusi Gaussian secara teori adalah bahwa nilainya berubah dari ke (walaupun probabilitasnya mendekati nol) dan jumlah koneksi tidak dapat negatif.+

Adakah yang tahu distribusi mana yang diharapkan jika masing-masing orang secara independen (secara acak) mengambil orang lain untuk dihubungkan?

niko
sumber
1
Klarifikasi: Apakah pertanyaan tentang "jumlah koneksi untuk seluruh grup" atau "jumlah koneksi untuk satu orang"? Jawaban saya secara implisit mengasumsikan yang terakhir.
1
Distribusi Riley ? Itu yang baru pada saya. Apakah Anda memiliki referensi atau tautan?
onestop
3
"Rayleigh" mungkin?
whuber

Jawaban:

6

Bila ada orang dan jumlah koneksi yang dibuat oleh orang i , 1 i n , adalah X i , maka jumlah total koneksi adalah S n = Σ n i = 1 X i / 2 . Sekarang jika kita menganggap X i sebagai variabel acak, anggaplah mereka independen dan variansnya tidak "terlalu tidak setara" karena semakin banyak orang ditambahkan ke dalam campuran, maka Teorema Batas Pusat Lindeberg-Levy berlaku. Ini menegaskan bahwa fungsi distribusi kumulatifni,1in,XiSn=i=1nXi/2Xidari jumlah standar yang menyatu dengan cdf dari distribusi normal. Itu berarti secara kasar bahwa histogram penjumlahan akan terlihat lebih dan lebih seperti Gaussian ("kurva lonceng") ketika tumbuh besar.n

Mari kita tinjau apa yang tidak dikatakan ini:

  • Ini tidak menyatakan bahwa distribusi selalu benar-benar normal. Tidak mungkin, karena alasan yang Anda tunjukkan.Sn

  • Itu tidak menyiratkan jumlah koneksi yang diharapkan konvergen. Bahkan, ia harus menyimpang (pergi hingga tak terbatas). Standarisasi adalah penyebarluasan dan pengubahan ukuran distribusi; jumlah penyelamatan tumbuh tanpa batas.

  • Xin

whuber
sumber
Perhatikan bahwa saya tidak menafsirkan pertanyaan untuk menyatakan bahwa setiap orang memilih dengan tepat satu orang lain untuk dihubungkan - yang akan mengarah pada teori steril karena jumlah koneksi akan ditentukan, bukan acak. Sebagai gantinya saya telah menafsirkannya untuk menyatakan bahwa setiap orang ketika mereka memasuki jaringan memilih koneksi secara acak di antara yang lain, menutup dengan mana saja dari 0 hingga n total koneksi. Asumsi pada varians terjamin ketika ada batasan jumlah koneksi yang akan dibuat oleh pendatang baru dan jumlah itu memiliki keacakan "minimal".
whuber
Xi
1
@Andy Bukan orang: jumlah koneksi yang dibuat. Yang penting adalah bahwa harus ada peluang bagus bahwa jumlah koneksi yang dibuat oleh individu benar-benar bervariasi dan tidak menetap hingga konstan. Ketika itu terjadi, distribusi terbatas (dari jumlah koneksi) ditentukan oleh jumlah terbatas koneksi awal yang bervariasi, sehingga tidak mungkin untuk mendekati distribusi Normal asimptotik.
whuber
1

Jawabannya tergantung pada asumsi yang ingin Anda buat. Jaringan sosial terus berkembang dari waktu ke waktu dan karenanya bukan entitas statis. Oleh karena itu, Anda perlu membuat beberapa asumsi tentang bagaimana jaringan berkembang dari waktu ke waktu.

n

PrHaib(Tidak ada koneksi untuk setiap individu=n-1)=1

Jika seseorang memilih orang lain secara acak untuk terhubung maka pada akhirnya semua orang akan terhubung.

Namun, jaringan kehidupan nyata tidak berperilaku seperti ini. Orang berbeda dalam beberapa aspek.

  1. Setiap saat seseorang memiliki ukuran jaringan tetap dan kemungkinan koneksi lain yang dibuat adalah fungsi dari ukuran jaringannya (ketika orang memperkenalkan orang lain, dll.).

  2. Seseorang memiliki kecenderungan intrinsiknya sendiri untuk membentuk koneksi (karena beberapa introvert / exterovert dll).

Probabilitas ini berubah seiring waktu, konteks, dll. Saya tidak yakin ada jawaban langsung kecuali kita membuat beberapa asumsi tentang struktur jaringan (misalnya, kepadatan jaringan, bagaimana orang berperilaku dll).


sumber
@ Srikant Bisakah Anda menjelaskan bagaimana Anda memperoleh "jawaban sepele"? (Pasti ada beberapa asumsi yang tidak disebutkan di baliknya.) Dan pada teorema apa yang Anda rujuk ketika Anda menyimpulkan bahwa "pada akhirnya semua orang akan terhubung"? Sama sekali tidak jelas!
whuber
@whuber Saya berasumsi bahwa ukuran jaringan sudah diperbaiki. Pertanyaannya menyatakan: Seseorang memilih orang lain secara acak untuk membuat koneksi dan mungkin ini adalah proses yang berkelanjutan. Dengan demikian, seiring berjalannya waktu hingga tak terbatas setiap orang harus terhubung. Tidak ada teorema, hanya intuisi. Mungkin, saya menggunakan bahasa yang tidak tepat.
@ Srikant Saya masih bingung, karena setelah waktu yang lama, "Prob (Tidak ada koneksi = n)" sama dengan 1 ketika n = 3 dan sebaliknya selalu nol. Lagi pula, ketika "semua orang harus terhubung" jumlah koneksi sama dengan n (n-1) / 2. Saya menduga Anda mungkin memiliki beberapa proses acak yang berbeda dalam pikiran pada saat yang sama. Ini bisa membantu untuk mengungkapkan asumsi yang Anda buat dan menjadi sedikit lebih tepat.
whuber