Saya melakukan analisis Matlab pada data MRI di mana saya telah melakukan PCA pada matriks berukuran 10304x236 di mana 10304 adalah jumlah voxel (menganggapnya sebagai piksel) dan 236 adalah jumlah titik waktu. PCA memberi saya nilai Eigen 236 dan koefisien terkait mereka. Ini semua baik-baik saja Namun ketika tiba saatnya untuk memutuskan berapa banyak komponen yang harus dipertahankan, makalah yang saya ulas mengatakan hal berikut (tolong beri tahu saya jika ada klarifikasi yang diperlukan karena ini hanya bagian singkat dari keseluruhan makalah):
Kami kemudian melakukan simulasi Monte Carlo untuk menentukan jumlah komponen utama (PC) untuk diekstrak dari data ROI yang mengganggu untuk setiap pemindaian. Distribusi nol dari nilai eigen yang diharapkan dihasilkan secara terpisah untuk data enkode dan data istirahat untuk setiap subjek dengan melakukan PCA pada data yang terdistribusi normal dengan peringkat yang sama dengan enkode dan data ROI gangguan lainnya. PC dari data ROI gangguan sejati kemudian dipilih untuk istirahat tertentu atau pemindaian pengkodean jika nilai eigen yang terkait melebihi interval kepercayaan ke-99 dari nilai eigen dari simulasi Monte Carlo.
Saya sama sekali tidak tahu apa yang harus saya lakukan di sini. Saya terbiasa memilih komponen berdasarkan varians kumulatif yang dijelaskan. Pemikiran saya adalah ini:
Kami kemudian melakukan simulasi Monte Carlo untuk menentukan jumlah komponen utama (PC) untuk diekstrak dari data ROI yang mengganggu untuk setiap pemindaian.
Sims Monte Carlo hanya bermaksud untuk melakukan 1000 (atau semacamnya) berikut kali, kan?
Distribusi nol dari nilai eigen yang diharapkan dihasilkan dengan melakukan PCA pada data yang terdistribusi normal dengan peringkat yang sama dengan data ROI penyandian dan gangguan lainnya.
Pertama, saya mengasumsikan 'peringkat yang sama' pada dasarnya akan berarti bahwa saya akan membuat matriks dengan ukuran yang sama seperti aslinya (10304x236). Dalam hal 'data terdistribusi normal dengan peringkat yang sama' ... apakah ini berarti saya harus membuat matriks 10304x236 angka acak dari distribusi normal? Matlab memiliki fungsi yang disebut 'normrnd' yang melakukan ini tetapi memerlukan input mu dan sigma. Apakah saya akan menggunakan mu dan sigma yang sama dengan yang berasal dari dataset awal? Apakah ini kurang lebih apa yang dimaksud dengan 'nilai eigen yang diharapkan' karena saya tidak tahu seperti apa distribusi nilai eigen yang diharapkan itu.
Saya kira masalah saya kurang lebih bahwa saya tidak tahu bagaimana membuat 'distribusi nol' dari nilai eigen.
sumber