Saya mencoba untuk memahami penggunaan PCA dalam artikel jurnal terbaru berjudul "Memetakan aktivitas otak pada skala dengan komputasi cluster" Freeman et al., 2014 (pdf gratis tersedia di situs web lab ). Mereka menggunakan PCA pada data deret waktu, dan menggunakan bobot PCA untuk membuat peta otak.
Data tersebut adalah data pencitraan rata-rata percobaan, disimpan sebagai matriks (disebut di kertas) dengan voxels (atau lokasi pencitraan di otak) titik waktu (panjang satu stimulasi ke otak). n× t
Mereka menggunakan SVD yang menghasilkan ( menunjukkan transpose dari matriks ).V⊤V
Penulis menyatakan itu
Komponen utama (kolom ) adalah vektor panjang , dan skor (kolom ) adalah vektor panjang (jumlah voxels), yang menggambarkan proyeksi setiap voxel pada arah diberikan oleh komponen yang sesuai, membentuk proyeksi pada volume, yaitu peta seluruh otak.t U n
Jadi PC adalah vektor dengan panjang . Bagaimana saya bisa mengartikan bahwa "komponen utama pertama menjelaskan perbedaan paling banyak" seperti yang umumnya dinyatakan dalam tutorial PCA? Kami mulai dengan matriks banyak seri waktu yang sangat berkorelasi - bagaimana seri waktu PC tunggal menjelaskan perbedaan dalam matriks asli? Saya memahami keseluruhan "rotasi awan Gaussian poin ke sumbu paling bervariasi", tetapi saya tidak yakin bagaimana ini berhubungan dengan deret waktu. Apa yang penulis maksudkan dengan arah ketika mereka menyatakan: "skor (kolom ) adalah vektor panjang n (jumlah voxel), yang menggambarkan proyeksi masing-masing voxel pada arah yang diberikan oleh komponen yang sesuai "? Bagaimana mungkin komponen waktu utama memiliki arah?
Untuk melihat contoh deret waktu yang dihasilkan dari kombinasi linier komponen utama 1 dan 2 dan peta otak yang terkait, buka tautan berikut dan arahkan mouse ke titik-titik dalam plot XY.
Pertanyaan kedua saya terkait dengan lintasan (ruang-negara) yang mereka buat menggunakan skor komponen utama.
Ini dibuat dengan mengambil 2 skor pertama (dalam kasus contoh "optomotor" yang telah saya uraikan di atas) dan memproyeksikan uji coba individual (digunakan untuk membuat matriks rata-rata uji coba yang dijelaskan di atas) ke dalam subruang utama dengan persamaan:
Seperti yang dapat Anda lihat dari film-film terkait, setiap jejak di ruang negara mewakili aktivitas otak secara keseluruhan.
Adakah yang bisa memberikan intuisi untuk apa arti "bingkai" film ruang angkasa negara, dibandingkan dengan gambar yang mengaitkan plot XY dari skor 2 PC pertama. Apa artinya pada "bingkai" tertentu untuk 1 percobaan percobaan berada di 1 posisi di ruang-XY dan percobaan lain berada di posisi lain? Bagaimana posisi plot XY dalam film terkait dengan jejak komponen utama dalam gambar tertaut yang disebutkan di bagian pertama pertanyaan saya?
sumber
Jawaban:
T1: Apa hubungan antara seri waktu PC dan "varian maksimum"?
Saya setuju dengan interpretasi @ Nestor di atas: setiap fitur asli kemudian dapat dilihat sebagai kombinasi linear dari PC, dan karena PC tidak berkorelasi satu sama lain, orang dapat menganggapnya sebagai fungsi dasar di mana fitur asli diuraikan menjadi. Ini sedikit mirip dengan analisis Fourier, tetapi alih-alih mengambil dasar tetap sinus dan cosinus, kami menemukan dasar "paling tepat" untuk dataset khusus ini, dalam arti bahwa PC pertama-tama menyumbang sebagian besar varian, dll.
"Akuntansi untuk sebagian besar varian" di sini berarti bahwa jika Anda hanya mengambil satu fungsi dasar (seri waktu) dan mencoba memperkirakan semua fitur Anda dengannya, maka PC pertama akan melakukan pekerjaan terbaik. Jadi intuisi dasar di sini adalah bahwa PC pertama adalah fungsi deret waktu yang cocok untuk semua deret waktu yang tersedia, dll.
Mengapa bagian ini dalam Freeman et al. sangat membingungkan?
Kalimat yang Anda kutip dari Freeman et al. memang cukup membingungkan:
Saya menemukan ini sangat membingungkan dan saya menyarankan untuk mengabaikan pilihan kata-kata mereka, tetapi hanya melihat formula. Dari titik ini saya akan terus menggunakan istilah yang saya suka, bukan bagaimana Freeman et al. gunakan itu.
T2: Apa lintasan ruang negara?
sumber
Sehubungan dengan pertanyaan kedua. Persamaan yang diberikan adalah
Saya belum pernah membahas metodologi pewarnaan sebelumnya, dan perlu beberapa saat sebelum saya percaya diri untuk mengomentari aspek itu. Saya menemukan komentar tentang kesamaan dengan Gambar 4c membingungkan karena pewarnaan diperoleh di sana oleh regresi per-voxel. Sedangkan pada Gambar 6 setiap jejak adalah artefak seluruh gambar. Kecuali jika saya mengatakannya dengan benar saya pikir itu adalah arah dari stimulus selama segmen waktu itu sesuai dengan komentar pada Gambar.
sumber