Distribusi dan Varians Jumlah Segitiga dalam Grafik Acak

10

Pertimbangkan grafik acak Erdos-Renyi . Himpunan simpul diberi label oleh . Himpunan tepi dibangun oleh proses acak.n V V = { 1 , 2 , , n } EG=(V(n),E(p))nVV={1,2,,n}E

Misalkan adalah probabilitas , maka masing-masing pasangan unordered dari simpul ( ) terjadi sebagai tepi dalam dengan probabilitas , terlepas dari pasangan lainnya.0 < p < 1 { i , j } i j E pp0<p<1{i,j}ijEp

Segitiga dalam adalah triple unordered dari simpul yang berbeda, sehingga , , dan adalah tepi .{ i , j , k } { i , j } { j , k } { k , i } GG{i,j,k}{i,j}{j,k}{k,i}G

Jumlah maksimum dari kemungkinan segitiga adalah (n3) . Mendefinisikan variabel random X menjadi hitungan diamati dari segitiga dalam grafik G .

Probabilitas bahwa tiga tautan secara bersamaan hadir adalah p3 . Oleh karena itu, nilai yang diharapkan dari X diberikan oleh E(X)=(n3)p3 . Secara naif, orang mungkin menebak bahwa varians diberikan oleh E(X2)=(n3)p3(1p3) , tetapi ini tidak terjadi.

Kode Mathematica berikut mensimulasikan masalah:

n=50;
p=0.6;
t=100;
myCounts=Table[Length[FindCycle[RandomGraph[BernoulliGraphDistribution[n,p]],3,All]],{tt,1,t}];
N[Mean[myCounts]] // 4216. > similar to expected mean
Binomial[n,3]p^3 // 4233.6
N[StandardDeviation[myCounts]] // 262.078 > not similar to "expected" std
Sqrt[Binomial[n,3](p^3)(1-p^3)] // 57.612
Histogram[myCounts]

Apa varian X ?

LBogaardt
sumber

Jawaban:

4

Biarkan iff membentuk segitiga. Kemudian dan masing-masing . Ini yang Anda gunakan untuk menghitung nilai yang diharapkan.Yijk=1{i,j,k}X=i,j,kYijkYijkBernoulli(p3)

Untuk varian, masalahnya adalah tidak independen. Memang, tulis Kita perlu menghitung , yang merupakan probabilitas bahwa kedua segitiga hadir. Ada beberapa kasus:Yijk

X2=i,j,ki,j,kYijkYijk.
E[YijkYijk]
  • Jika (3 simpul yang sama) maka . Akan ada istilah seperti itu dalam jumlah ganda.{i,j,k}={i,j,k}E[YijkYijk]=p3(n3)
  • Jika set dan memiliki 2 elemen yang sama, maka kita membutuhkan 5 edge yang ada untuk mendapatkan dua segitiga, sehingga . akan ada istilah tersebut dalam penjumlahan.{i,j,k}{i,j,k}E[YijkYijk]=p512(n4)
  • Jika set dan memiliki 1 elemen yang sama, maka kita membutuhkan 6 sisi, sehingga . Akan ada istilah tersebut dalam penjumlahan.{i,j,k}{i,j,k}E[YijkYijk]=p630(n5)
  • Jika set dan memiliki 0 elemen yang sama, maka kita membutuhkan 6 sisi, sehingga . Akan ada istilah tersebut dalam penjumlahan.{i,j,k}{i,j,k}E[YijkYijk]=p620(n6)

Untuk memverifikasi bahwa kami telah membahas semua kasus, perhatikan bahwa jumlah ditambahkan ke .(n3)2

(n3)+12(n4)+30(n5)+20(n6)=(n3)2

Mengingat untuk mengurangi kuadrat dari rata-rata yang diharapkan, menyatukan semua ini memberi:

E[X2]E[X]2=(n3)p3+12(n4)p5+30(n5)p6+20(n6)p6(n3)2p6

Dengan menggunakan nilai numerik yang sama dengan contoh Anda, kode R berikut menghitung deviasi standar, yang cukup dekat dengan nilai 262 dari simulasi Anda.

n=50
p=0.6
sqrt(choose(n, 3)*p^3+choose(n, 2)*(n-2)*(n-3)*p^5+(choose(n, 3)*choose(n-3, 3)+n*choose(n-1, 2)*choose(n-3, 2))*p^6-4233.6^2)
298.7945

Kode Mathematica berikut ini juga menghitung deviasi standar, yang memberikan hasil yang sama.

mySTD[n_,p_]:=Sqrt[Binomial[n,3]p^3+12Binomial[n,4]p^5+30 Binomial[n,5]p^6+20Binomial[n,6]p^6-(Binomial[n,3]p^3)^2]
mySTD[50,0.6] // gives 298.795
Robin Ryder
sumber
2
Sebenarnya cukup mudah. Sudah selesai dilakukan dengan baik! Saya sedikit memperbarui jawaban Anda, menyederhanakan ekspresi dan menambahkan kode Mathematica . Saya juga menjalankan simulasi 10k kali dan memperoleh std 295,37, sangat dekat dengan nilai yang diharapkan.
LBogaardt
1
Terima kasih atas hasil editnya. Saya senang bahwa simulasi dengan iterasi 10k mengkonfirmasi jawabannya!
Robin Ryder
Saya menemukan referensi asli, untuk grafik berarah: Holland (1970). Metode untuk Mendeteksi Struktur dalam Data Sosiometrik.
LBogaardt
0

Saya memberikan pendekatan yang sedikit berbeda untuk memperoleh .X2

Dengan perbedaan kasus yang sama seperti yang dilakukan Robin Ryder:

  • Jika yaitu 3 simpul adalah sama, maka kita harus memilih 3 simpul dari n yang mungkin . Kita harus memiliki 3 sisi sekarang . Gabungan:{i,j,k}={i,j,k}(n3)p3(n3)p3

  • Jika dan memiliki dua simpul yang sama, itu berarti yang dan sebaliknya (setiap segitiga memiliki satu simpul yang bukan bagian dari segitiga lainnya). Wlog bayangkan dan adalah simpul terpisah yang disebutkan dan = , = . Untuk mencapai = , = , kita harus memilih dua simpul yang sama dari n yang mungkin . Untuk{i,j,k}{i,j,k}v{i,j,k}v{i,j,k}v=kv=kiijjiijj(n2)kkkita harus mengambil dua lagi dari simpul yang tersisa. Yang pertama: dan yang kedua: . Karena edge dan adalah sama, kita harus memiliki 5 edge sekarang . Gabungan:(n2)(n3){i,j}{i,j}p5(n2)(n2)(n3)p5

  • Jika dan memiliki hanya satu simpul yang sama, maka 4 dipisahkan. Bayangkan, wlog, bahwa = . Itu berarti, dari n simpul yang memungkinkan, kita harus memilih 1 . Untuk segitiga kita memilih 2 simpul dari yang tersisa . Untuk segitiga kita memilih 2 dari yang tersisa , ini disebabkan oleh asumsi bahwa dan . Karena kita hanya memiliki satu simpul yang sama, kita harus memiliki 6 sisi{i,j,k}{i,j,k}iin{i,j,k}(n1)(n12){i,j,k}(n3)(n32)j{i,j,k}k{i,j,k}p6 . Gabungan:n(n12)(n32)p6

  • Untuk kasus terakhir: Jika dan memiliki tidak ada simpul yang sama, maka 2 segitiga dipisahkan. Kami memilih segitiga pertama, 3 simpul dari n kemungkinan . Dan segitiga kedua, 3 simpul dari tersisa . Segitiga terpisah, yaitu mereka tidak berbagi tepi dan simpul, sehingga 6 tepi harus ada . Gabungan:{i,j,k}{i,j,k}(n3)(n3)(n33)p6(n3)(n33)p6

Seperti dalam pendekatan Robin Ryder, kami juga dapat memverifikasi bahwa:

(n3)+(n2)(n2)(n3)+n(n12)(n32)+(n3)(n33)=(n3)2 berlaku.

Ini mengarah ke:

Var[X]=E[X2]E[X]2=(n3)p3+(n2)(n2)(n3)p5+n(n12)(n32)p6+(n3)(n33)p6(n3)2p6.

Josh
sumber