Saya menganalisis set data tentang komunitas intertidal. Data berupa persen tutupan (dari rumput laut, teritip, kerang, dll) dalam kuadrat. Saya terbiasa memikirkan analisis korespondensi (CA) dalam hal jumlah spesies , dan analisis komponen utama (PCA) sebagai sesuatu yang lebih berguna untuk tren lingkungan (bukan spesies) linier. Saya belum benar-benar beruntung mengetahui apakah PCA atau CA akan lebih cocok untuk persen penutup (tidak dapat menemukan kertas), dan saya bahkan tidak yakin bagaimana sesuatu yang dibatasi hingga 100% akan didistribusikan ?
Saya akrab dengan pedoman kasar bahwa jika panjang sumbu analisis korespondensi detrended (DCA) pertama lebih besar dari 2, maka Anda dapat dengan aman berasumsi bahwa CA harus digunakan. Panjang sumbu DCA 1 adalah 2,17, yang menurut saya tidak membantu.
sumber
Jawaban:
PCA bekerja pada nilai-nilai dimana CA bekerja pada nilai-nilai relatif. Keduanya baik untuk data kelimpahan relatif dari jenis yang Anda sebutkan (dengan satu peringatan utama, lihat nanti). Dengan% data Anda sudah memiliki ukuran relatif, tetapi masih akan ada perbedaan. Bertanya pada diri sendiri
Jika yang pertama, gunakan PCA. Jika yang terakhir menggunakan CA. Apa yang saya maksud dengan dua pertanyaan itu adalah yang Anda inginkan
dianggap berbeda atau sama?
A
danB
dua sampel dan nilainya adalah% penutup dari tiga taksa yang ditunjukkan. (Contoh ini ternyata buruk, anggap ada tanah kosong! ;-) PCA akan mempertimbangkan ini sangat berbeda karena jarak Euclidean yang digunakan, tetapi CA akan menganggap kedua sampel ini sangat mirip karena memiliki profil relatif yang sama.Peringatan besar di sini adalah sifat komposisi data yang tertutup. Jika Anda memiliki beberapa kelompok (Pasir, Lumpur, Tanah Liat, misalnya) yang berjumlah 1 (100%) maka tidak ada pendekatan yang benar dan Anda dapat pindah ke analisis yang lebih tepat melalui Aitchison's Log-rasio PCA yang dirancang untuk komposisi tertutup data. (IIRC untuk melakukan ini, Anda perlu memusatkan pada baris dan kolom, dan log mentransformasikan data.) Ada pendekatan lain juga. Jika Anda menggunakan R, maka salah satu buku yang akan berguna Menganalisis komposisional data dengan R .
sumber