Apa perbedaan antara PCA dan PCA asimptotik?

23

Dalam dua makalah pada tahun 1986 dan 1988 , Connor dan Korajczyk mengusulkan pendekatan untuk pemodelan pengembalian aset. Karena rangkaian waktu ini biasanya memiliki lebih banyak aset daripada pengamatan periode waktu, mereka mengusulkan untuk melakukan PCA pada kovarian lintas-seksi pengembalian aset. Mereka menyebut metode ini Asymptotic Principal Component Analysis (APCA, yang agak membingungkan, karena penonton langsung berpikir tentang sifat asimptotik PCA).

Saya telah mengerjakan persamaannya, dan kedua pendekatan itu tampak setara secara numerik. Asimptotik tentu saja berbeda, karena konvergensi terbukti untuk daripada . Pertanyaan saya adalah: apakah ada yang menggunakan APCA dan dibandingkan dengan PCA? Apakah ada perbedaan nyata? Jika ya, yang mana?NT

gappy
sumber
2
0 down vote Gappy:> ini bukan jawaban untuk pertanyaan Anda, tetapi sebuah alternatif, lebih baru, dan sering lebih kuat dari perkiraan sampel, pendekatan untuk masalah ini: VAR Bayesian Besar, lihat ide-ide
user603
5
Bagaimana bisa mereka berbeda jika mereka secara numerik setara?
John Salvatier
Karena PCA dalam proses Markov secara asimptotik merupakan transformasi Cosine, bukankah itu artinya dalam APCA?
JohnRos
Halo @ senang! Saya bertanya-tanya apakah jawaban saya bermanfaat atau meyakinkan. Jika Anda pikir itu tidak benar (atau tidak adil untuk "PCA asimptotik"), saya ingin tahu pendapat Anda tentang masalah ini.
Amuba mengatakan Reinstate Monica

Jawaban:

6

Sama sekali tidak ada perbedaan.

Sama sekali tidak ada perbedaan antara PCA standar dan apa yang disarankan C&K dan disebut "PCA asimptotik". Sangat konyol untuk memberinya nama yang terpisah.

Berikut ini penjelasan singkat tentang PCA. Jika data terpusat dengan sampel dalam baris disimpan dalam matriks data , maka PCA mencari vektor eigen dari matriks kovarians , dan memproyeksikan data tentang ini vektor eigen untuk mendapatkan komponen utama. Secara ekuivalen, seseorang dapat mempertimbangkan matriks Gram, . Sangat mudah untuk melihat bahwa memiliki nilai eigen yang persis sama, dan vektor eigennya adalah skala PC. (Ini nyaman ketika jumlah sampel kurang dari jumlah fitur.)X1NXX1NXX

Menurut saya, apa yang disarankan C&K adalah menghitung vektor eigen dari matriks Gram untuk menghitung komponen utama. Wah, wow. Ini bukan "setara" dengan PCA; itu adalah PCA.

Untuk menambah kebingungan, nama "PCA asimptotik" tampaknya merujuk hubungannya dengan analisis faktor (FA), bukan PCA! Koran-koran C&K asli berada di bawah paywall, jadi di sini adalah kutipan dari Tsay, Analysis of Financial Time Series, yang tersedia di Google Books:

Connor dan Korajczyk (1988) menunjukkan bahwa [jumlah fitur] eigenvalue-eigenvectorvektor [the Gram matrix] setara dengan analisis faktor statistik tradisional.k

Apa ini sebenarnya berarti bahwa ketika , PCA memberikan solusi yang sama dengan FA. Ini adalah fakta yang mudah dipahami tentang PCA dan FA, dan itu tidak ada hubungannya dengan apa pun yang disarankan C&K. Saya membahasnya di utas berikut:k

Jadi intinya adalah: C&K memutuskan untuk membuat istilah "asimptotik PCA" untuk PCA standar (yang juga bisa disebut "FA asimptotik"). Saya akan merekomendasikan untuk tidak menggunakan istilah ini.

amuba kata Reinstate Monica
sumber
2

Biasanya APCA digunakan ketika ada banyak seri tetapi sangat sedikit sampel. Saya tidak akan menggambarkan APCA sebagai lebih baik atau lebih buruk daripada PCA, karena kesetaraan yang Anda catat. Namun, mereka berbeda ketika alat berlaku. Itulah wawasan dari makalah ini: Anda dapat membalik dimensi jika lebih nyaman! Jadi dalam aplikasi yang Anda sebutkan, ada banyak aset sehingga Anda akan membutuhkan seri waktu yang lama untuk menghitung matriks kovarian, tetapi sekarang Anda dapat menggunakan APCA. Yang mengatakan, saya tidak berpikir APCA akan diterapkan sangat sering karena Anda dapat mencoba mengurangi dimensi menggunakan teknik lain (seperti analisis faktor).

pembuat pikiran
sumber
(-1) Saya tidak mengerti: apakah mereka setara atau tidak, menurut Anda? Jika ya, lalu bagaimana mungkin mereka berbeda ketika mereka berlaku?
Amoeba berkata Reinstate Monica