Apa artinya ketika semua tepi dalam jaringan / grafik dunia nyata secara statistik sama mungkin terjadi secara kebetulan?

11

Saya telah menggunakan metode ekstraksi jaringan backbone yang diuraikan dalam makalah ini: http://www.pnas.org/content/106/16/6483.abstract

Pada dasarnya, penulis mengusulkan suatu metode yang didasarkan pada statistik yang menghasilkan probabilitas, untuk setiap sisi dalam grafik, bahwa sisi tersebut dapat terjadi hanya secara kebetulan. Saya menggunakan batas signifikansi statistik khas 0,05.

Saya telah menerapkan metode ini ke beberapa jaringan dunia nyata, dan yang menarik beberapa jaringan berakhir tanpa batas yang signifikan. Saya mencoba memahami apa yang diperlukan untuk jaringan ini. Satu-satunya waktu saya menerapkan metode ini ke jaringan dan tidak ada sisi yang lebih penting adalah ketika saya menerapkan metode ini ke jaringan acak yang saya hasilkan, yang persis seperti yang kami harapkan.

Sebagai contoh jaringan dunia nyata, Anda mungkin telah melihat visualisasi jaringan baru-baru ini yang berlangsung pada The Economist yang menunjukkan polarisasi Senat AS dalam 25 tahun terakhir: http://www.economist.com/news/united-states/21591190 -united-States-amoeba . Saya menerapkan metode ekstraksi jaringan backbone ke jaringan-jaringan itu dan tidak ada tepian yang signifikan. Meskipun tepian mentah tampaknya menunjukkan perlekatan dan pengelompokan preferensial, apakah ini kebetulan? Apakah jaringan jaringan pemungutan suara Senat pada dasarnya acak?

probability statistical-significance data-visualization graph-theory networks Randy Olson
sumber

6

Hipotesis nol di balik metode backbone adalah

[Berat] bobot dinormalisasi yang sesuai dengan koneksi node tertentu derajat k diproduksi oleh tugas acak dari distribusi seragam.

Jika tidak ada tepi "signifikan", hipotesis nol berlaku untuk seluruh grafik, yaitu, bobot tepi hasil dari kecenderungan nodal untuk mengirim dan menerima ikatan.

Bergantung pada hubungan yang Anda analisis, metode backbone mungkin tidak sesuai. Metode ini berfungsi paling baik untuk jaringan yang secara konseptual merupakan jaringan satu-mode. Jaringan dua mode dapat diproyeksikan sebagai jaringan satu mode berbobot, tetapi seringkali tidak masuk akal untuk melakukannya.

Mengambil contoh Anda di Economist, tidak masuk akal untuk menganalisis pemungutan suara Senat sebagai jaringan satu mode yang dibobot oleh jumlah suara yang dibagikan. Voting di Senat adalah hubungan dua mode yang ditandatangani. Senator (i) memiliki hubungan dengan bagian undang-undang (j) dan mereka abstain memilih (0) atau mereka memilih (+1) atau menentang (-1) undang-undang. Untuk mengubah jaringan menjadi jaringan perjanjian satu mode tertimbang, kemudian melakukan analisis tulang punggung akan menjadi pengurangan data yang parah. Beberapa undang-undang lebih bersifat memecah-belah secara politis dan beberapa memiliki suara lebih banyak daripada yang lain - metode backbone tidak akan menangkap mekanisme ini.

Anda mungkin ingin mempertimbangkan pengujian Conditional Uniform Graph (CUG) alih-alih metode backbone. Gagasan di balik tes ini adalah untuk menentukan apakah properti tingkat-grafik tertentu (misalnya, pengelompokan, panjang jalur rata-rata, sentralisasi, homofili) dihasilkan dari kebetulan. Prosesnya adalah sebagai berikut:

Ambil pengukuran f dari grafik yang diamati
Hasilkan grafik acak yang mengontrol properti tertentu dari grafik yang diamati (misalnya, ukuran, jumlah tepi, distribusi derajat, dll)
Ambil pengukuran f dari grafik acak
Ulangi langkah 2 dan 3 berkali-kali (mis. 1000) untuk menghasilkan distribusi nol
Bandingkan pengukuran yang diamati dengan distribusi nol

Untuk jaringan dua mode, masuk akal untuk membuat grafik acak dengan permutasi grafik yang diamati (baik tnet dan statnet di R memiliki rutin untuk permutasi jaringan dua mode). Jika pengukuran f memerlukan jaringan satu mode, proses pengacakan harus dilakukan pada jaringan dua mode sebelum memproyeksikannya sebagai jaringan satu mode.

BenjaminLind
sumber

4

Dalam artikel yang Anda kutip, penulis menganggap bahwa, dalam jaringan yang kompleks, "simpul mewakili elemen-elemen dari sistem [yang dimodelkan] dan ujung-ujungnya yang berbobot mengidentifikasi adanya interaksi dan kekuatan relatifnya" (penekanan oleh saya) .

Di jaringan yang Anda pelajari, jika saya memahami dengan benar artikel Economist, ada tautan antara 2 senator jika mereka memberikan suara yang sama setidaknya 100 kali. Jadi, tautannya tidak memodelkan interaksi, tetapi kesamaan (antara perilaku pemilih senator). Dari pengalaman saya, jaringan kesamaan tidak menunjukkan distribusi derajat yang sama dari jaringan interaksi, dalam arti itu tidak heterogen. Juga, parameter ambang yang digunakan saat mengekstraksi jaringan (di sini: 100) kadang-kadang memiliki efek yang kuat pada distribusi derajat.

Selain itu, saya tidak dapat menemukan penyebutan bobot dalam artikel Economist. Namun, keberadaan bobot tampaknya menjadi poin penting dalam metode yang dijelaskan dalam karya Ángeles Serrano et al . Anda mengutip dalam pertanyaan Anda.

Dari dua pengamatan ini, tampaknya mungkin metode ini tidak bekerja secara akurat pada data ini karena tidak dirancang untuk memproses jaringan jenis ini. Mungkin Anda dapat memeriksa distribusi derajat: apakah berpusat pada nilai karakteristik, atau heterogen? Dan bagaimana dengan bobotnya, apakah ada?

Vincent Labatut
sumber

Saya mereproduksi data sendiri dari situs web sumber, jadi saya memasukkan bobot dan tidak menerapkan ambang batas cutoff sewenang-wenang. Jadi saya pikir data saya menerapkan metode backbone seharusnya tidak terpengaruh oleh masalah ini. Ide bagus untuk memeriksa distribusi gelar - saya harus memeriksanya!

Randy Olson

Apa artinya ketika semua tepi dalam jaringan / grafik dunia nyata secara statistik sama mungkin terjadi secara kebetulan?

Jawaban: