Dalam dua makalah pada tahun 1986 dan 1988 , Connor dan Korajczyk mengusulkan pendekatan untuk pemodelan pengembalian aset. Karena rangkaian waktu ini biasanya memiliki lebih banyak aset daripada pengamatan periode waktu, mereka mengusulkan untuk melakukan PCA pada kovarian lintas-seksi pengembalian aset. Mereka menyebut metode ini Asymptotic Principal Component Analysis (APCA, yang agak membingungkan, karena penonton langsung berpikir tentang sifat asimptotik PCA).
Saya telah mengerjakan persamaannya, dan kedua pendekatan itu tampak setara secara numerik. Asimptotik tentu saja berbeda, karena konvergensi terbukti untuk daripada . Pertanyaan saya adalah: apakah ada yang menggunakan APCA dan dibandingkan dengan PCA? Apakah ada perbedaan nyata? Jika ya, yang mana?
sumber
Jawaban:
Sama sekali tidak ada perbedaan.
Sama sekali tidak ada perbedaan antara PCA standar dan apa yang disarankan C&K dan disebut "PCA asimptotik". Sangat konyol untuk memberinya nama yang terpisah.
Berikut ini penjelasan singkat tentang PCA. Jika data terpusat dengan sampel dalam baris disimpan dalam matriks data , maka PCA mencari vektor eigen dari matriks kovarians , dan memproyeksikan data tentang ini vektor eigen untuk mendapatkan komponen utama. Secara ekuivalen, seseorang dapat mempertimbangkan matriks Gram, . Sangat mudah untuk melihat bahwa memiliki nilai eigen yang persis sama, dan vektor eigennya adalah skala PC. (Ini nyaman ketika jumlah sampel kurang dari jumlah fitur.)X 1NX⊤X 1NX X⊤
Menurut saya, apa yang disarankan C&K adalah menghitung vektor eigen dari matriks Gram untuk menghitung komponen utama. Wah, wow. Ini bukan "setara" dengan PCA; itu adalah PCA.
Untuk menambah kebingungan, nama "PCA asimptotik" tampaknya merujuk hubungannya dengan analisis faktor (FA), bukan PCA! Koran-koran C&K asli berada di bawah paywall, jadi di sini adalah kutipan dari Tsay, Analysis of Financial Time Series, yang tersedia di Google Books:
Apa ini sebenarnya berarti bahwa ketika , PCA memberikan solusi yang sama dengan FA. Ini adalah fakta yang mudah dipahami tentang PCA dan FA, dan itu tidak ada hubungannya dengan apa pun yang disarankan C&K. Saya membahasnya di utas berikut:k → ∞
Jadi intinya adalah: C&K memutuskan untuk membuat istilah "asimptotik PCA" untuk PCA standar (yang juga bisa disebut "FA asimptotik"). Saya akan merekomendasikan untuk tidak menggunakan istilah ini.
sumber
Biasanya APCA digunakan ketika ada banyak seri tetapi sangat sedikit sampel. Saya tidak akan menggambarkan APCA sebagai lebih baik atau lebih buruk daripada PCA, karena kesetaraan yang Anda catat. Namun, mereka berbeda ketika alat berlaku. Itulah wawasan dari makalah ini: Anda dapat membalik dimensi jika lebih nyaman! Jadi dalam aplikasi yang Anda sebutkan, ada banyak aset sehingga Anda akan membutuhkan seri waktu yang lama untuk menghitung matriks kovarian, tetapi sekarang Anda dapat menggunakan APCA. Yang mengatakan, saya tidak berpikir APCA akan diterapkan sangat sering karena Anda dapat mencoba mengurangi dimensi menggunakan teknik lain (seperti analisis faktor).
sumber