Cara terbaik untuk mengelompokkan matriks adjacency

9

Saya mengalami kesulitan menafsirkan cluster yang dihasilkan dari matriks adjacency. Saya memiliki 200 matriks yang relatif besar yang mewakili mata pelajaran yang berisi korelasi parsial (skor z) dari deret waktu (data saraf). Tujuannya adalah untuk mengelompokkan 210 matriks tersebut dan mendeteksi potensi komunitas yang belum ditemukan. Jadi saya melakukan perhitungan korelasi parsial lain yang menghasilkan matriks adjacency 200x200. Setiap kali saya menjalankan algoritme deteksi komunitas (misalnya Newmann), ia muncul dengan komunitas yang sulit ditafsirkan.

Pertanyaannya adalah tes statistik apa yang akan memberi tahu apakah komunitas atau kelompok ini signifikan? dan jika demikian, adakah cara sistematis untuk menyelesaikan penafsiran?

Fahd
sumber
Sejauh yang saya ketahui tidak ada 'cara yang benar' untuk melakukan ini. Suatu pendekatan akan menggunakan sesuatu seperti pengelompokan hierarkis pada matriks jarakmana adalah korelasi. Hal lain adalah apakah matriks korelasi terakhir Anda akan menangkap hubungan yang bermakna. Langkah apa yang diambil untuk memproduksinya? 1-|ρ|ρ
Dugaan
Terima kasih. Mengenai pertanyaan Anda, hal yang saya lakukan adalah saya mengkorelasikan setiap baris (atau data subjek) dengan setiap subjek lainnya menggunakan corrcoef (korelasi sederhana) dan itulah bagaimana saya mendapatkan hasilnya. Saya mencoba mendeteksi polanya dan itulah sebabnya saya harus berkorelasi lagi.
Fahd
di OP disarankan bahwa data subjek dinilai matriks jadi bagaimana ini menjadi satu baris per subjek?
Dugaan

Jawaban:

2

Saya telah melakukan beberapa pekerjaan di masa lalu pada pengelompokan spektral yang mungkin berguna di sini. Ide dasarnya adalah seseorang dapat menggunakan matriks adjacency untuk membentuk apa yang disebut matriks Laplacian:

L.=saya-D-1/2SEBUAHD-1/2

Anda dapat memeriksa sendiri bahwa nilai eigen terendah dari Laplacian adalah nol. Nilai eigen bukan nol pertama sering disebut konektivitas aljabar, dan eignevektor yang sesuai akan memiliki bagian positif dan negatif yang terkait dengan dua partisi dari grafik yang mendasarinya. Secara kasar, besarnya nilai pertama bukan nol adalah ukuran kekuatan koneksi antara kedua partisi. Mungkin Anda bisa menggunakan pendekatan ini secara rekursif atau mempertimbangkan beberapa nilai non-nol pertama Laplacian. Artikel Wikipedia berikut tentang pengelompokan spektral adalah awal yang baik.(B1,B2)

Abbas
sumber
2

Saya melihat masalah yang sama saat ini. Dari tinjauan cepat, sepertinya pengelompokan spektral adalah cara yang paling "alami" untuk menganalisis matriks Adjacency. Lihat posting blog ini untuk lebih jelasnya.

Hanan Shteingart
sumber
0

Atau ... Data saraf (nyata atau buatan) sering merupakan representasi data yang sangat terkompresi, yang berarti data tersebut sangat acak, yang berarti Anda tidak akan menemukan korelasi. Yang kamu miliki !! Selamat! :)

sinar
sumber