Saya mengalami kesulitan menafsirkan cluster yang dihasilkan dari matriks adjacency. Saya memiliki 200 matriks yang relatif besar yang mewakili mata pelajaran yang berisi korelasi parsial (skor z) dari deret waktu (data saraf). Tujuannya adalah untuk mengelompokkan 210 matriks tersebut dan mendeteksi potensi komunitas yang belum ditemukan. Jadi saya melakukan perhitungan korelasi parsial lain yang menghasilkan matriks adjacency 200x200. Setiap kali saya menjalankan algoritme deteksi komunitas (misalnya Newmann), ia muncul dengan komunitas yang sulit ditafsirkan.
Pertanyaannya adalah tes statistik apa yang akan memberi tahu apakah komunitas atau kelompok ini signifikan? dan jika demikian, adakah cara sistematis untuk menyelesaikan penafsiran?
sumber
Jawaban:
Saya telah melakukan beberapa pekerjaan di masa lalu pada pengelompokan spektral yang mungkin berguna di sini. Ide dasarnya adalah seseorang dapat menggunakan matriks adjacency untuk membentuk apa yang disebut matriks Laplacian:
Anda dapat memeriksa sendiri bahwa nilai eigen terendah dari Laplacian adalah nol. Nilai eigen bukan nol pertama sering disebut konektivitas aljabar, dan eignevektor yang sesuai akan memiliki bagian positif dan negatif yang terkait dengan dua partisi dari grafik yang mendasarinya. Secara kasar, besarnya nilai pertama bukan nol adalah ukuran kekuatan koneksi antara kedua partisi. Mungkin Anda bisa menggunakan pendekatan ini secara rekursif atau mempertimbangkan beberapa nilai non-nol pertama Laplacian. Artikel Wikipedia berikut tentang pengelompokan spektral adalah awal yang baik.(B1,B2)
sumber
Saya melihat masalah yang sama saat ini. Dari tinjauan cepat, sepertinya pengelompokan spektral adalah cara yang paling "alami" untuk menganalisis matriks Adjacency. Lihat posting blog ini untuk lebih jelasnya.
sumber
Atau ... Data saraf (nyata atau buatan) sering merupakan representasi data yang sangat terkompresi, yang berarti data tersebut sangat acak, yang berarti Anda tidak akan menemukan korelasi. Yang kamu miliki !! Selamat! :)
sumber