Apa metrik "terbaik" untuk matriks kovarian, dan mengapa? Jelas bagi saya bahwa Frobenius & c tidak tepat, dan sudut pandang memiliki masalah mereka juga. Secara intuitif seseorang mungkin menginginkan kompromi antara keduanya, tetapi saya juga ingin tahu apakah ada aspek lain yang perlu diingat dan mungkin standar yang sudah mapan.
Metrik umum memiliki berbagai kelemahan karena tidak alami untuk matriks kovarian, misalnya mereka sering tidak menghukum matriks non PSD atau tidak berperilaku peringkat pangkat baik (pertimbangkan dua ellipsoid kovarians peringkat rendah yang diputar: Saya ingin hal yang sama - rotasi menengah langsung memiliki jarak yang lebih rendah dari rata-rata komponen-komponen, yang tidak terjadi pada dan mungkin Frobenius, perbaiki saya di sini). Cembung juga tidak selalu dijamin. Akan lebih baik melihat ini dan masalah lain yang ditangani oleh metrik "baik".
Berikut ini adalah diskusi yang bagus tentang beberapa masalah, satu contoh dari optimasi jaringan dan satu dari visi komputer . Dan inilah pertanyaan serupa yang mendapatkan metrik lain tetapi tanpa diskusi.
sumber
Jawaban:
Yah, saya tidak berpikir ada metrik yang baik atau 'cara terbaik' untuk menganalisis matriks Kovarian. Analisis harus selalu selaras dengan tujuan Anda. Katakanlah C adalah matriks kovarians saya. Diagonal berisi varian untuk setiap parameter yang dihitung. Jadi, jika Anda tertarik pada signifikansi parameter, maka penelusuran (C) adalah awal yang baik karena ini adalah keseluruhan kinerja Anda.
Jika Anda memplot parameter Anda dan signifikansinya, Anda dapat melihat sesuatu seperti ini:
Jika Anda tertarik pada korelasi timbal balik mereka maka tabel seperti itu mungkin menghasilkan sesuatu yang menarik:
Setiap elemen adalah koefisien korelasi antara parameter xi dan xj. Dari contoh terlihat bahwa parameter x1 dan x2 sangat berkorelasi.
sumber
Pertanyaan menarik, saya bergulat dengan masalah yang sama saat ini! Itu tergantung pada bagaimana Anda mendefinisikan 'terbaik', yaitu, apakah Anda mencari beberapa nilai tunggal rata-rata untuk penyebaran, atau untuk korelasi antara data, dll. Saya temukan di Press, SJ (1972): Applied Multivariate Analysis, hal. 108 bahwa varians umum, didefinisikan sebagai penentu matriks kovarians, berguna sebagai ukuran tunggal untuk penyebaran. Tetapi jika itu adalah korelasi yang Anda cari, saya perlu berpikir lebih jauh. Biarkan aku tahu.
sumber