Untuk norma vektor, norma L2 atau "Euclidean distance" adalah definisi yang banyak digunakan dan intuitif. Tetapi mengapa definisi norma "paling sering digunakan" atau "standar" untuk sebuah matriks adalah norma spektral , tetapi bukan norma Frobenius (yang mirip dengan norma L2 untuk vektor)?
Apakah itu ada hubungannya dengan algoritma iteratif / kekuatan matriks (jika jari-jari spektrum lebih kecil dari 1, maka algoritme akan menyatu)?
Itu selalu bisa diperdebatkan untuk kata-kata seperti "paling sering digunakan", "default". Kata "default" yang disebutkan di atas berasal dari tipe pengembalian default dalam
Matlab
fungsinorm
. DalamR
norma default untuk matriks adalah norma L1. Keduanya "tidak alami" bagi saya (untuk matriks, tampaknya lebih "alami" untuk dilakukan seperti dalam vektor). (Terima kasih atas komentar @ usεr11852 dan @ whuber dan maaf atas kebingungannya.)Mungkin memperluas penggunaan norma matriks akan membantu saya untuk lebih mengerti?
sumber
norm
R
daftar saya norma sebagai default, bukan norma spektral.Jawaban:
Secara umum, saya tidak yakin bahwa norma spektral adalah yang paling banyak digunakan. Misalnya norma Frobenius digunakan untuk memperkirakan solusi pada factorisation matriks non-negatif atau korelasi / kovarians matriks regularisasi . Saya pikir bagian dari pertanyaan ini bermula dari kesalahan istilah yang dilakukan sebagian orang (termasuk saya sendiri) ketika merujuk pada norma Frobenius sebagai norma matriks Euclidean . Kita tidak boleh karena sebenarnya norma matriks (yaitu. Norma spektral) adalah salah satu yang diinduksi ke matriks ketika menggunakan norma vektor L 2 . Norma Frobenius adalah elemen-bijaksana: | | A | |L2 L2 , sedangkannorma matriksL2(||A||2=√||A||F=∑i,ja2i,j−−−−−−√ L2 ) didasarkan pada nilai singular sehingga lebih "univeral". (untuk keberuntungan istilah yang lebih baik?)Norma matriksL2adalah norma tipe Euclidean karena diinduksi oleh norma vektor Euclidean, di mana| | A| | 2=maks | | x | | 2 = 1 | | Ax| | 2. Oleh karena itu itu merupakannorma yang diinduksiuntuk matriks karenadiinduksioleh a||A||2=λmax(ATA)−−−−−−−−−√) L2 ||A||2=max||x||2=1||Ax||2 norma vektor , norma vektor dalam hal ini.L2
Mungkin MATLAB bertujuan untuk menyediakan norma secara default saat menggunakan perintah ; sebagai konsekuensinya ia menyediakan Euclidean vektor norma tetapi juga L 2 matriks norma, yaitu. yang spektral matriks norma (daripada salah dikutip " Frobenius / Euclidean matrix norma "). Akhirnya izinkan saya mencatat bahwa apa yang merupakan norma standar adalah masalah pendapat untuk beberapa hal: Misalnya " Aljabar Matriks - Teori, Komputasi, dan Aplikasi JE Gentle " secara harfiah memiliki bab (3.9.2) bernama: " The Frobenius Norma - Norma “Biasa”L2 L2 "; begitu jelas norma spektral bukanlah norma default untuk semua pihak yang dipertimbangkan! :) Seperti yang dikomentari oleh @amoeba, komunitas yang berbeda mungkin memiliki konvensi terminologi yang berbeda. Tak perlu dikatakan bahwa saya pikir buku Gentle adalah sumber daya yang tak ternilai dalam hal Aplikasi Aljabar Lin dalam Statistik dan saya akan meminta Anda untuk melihatnya lebih jauh!
norm
sumber
Sebagian dari jawabannya mungkin terkait dengan komputasi numerik.
Ketika Anda memecahkan sistemAx=b
dalam ketepatan terbatas, Anda tidak mendapatkan jawaban yang tepat untuk masalah itu. Anda mendapatkan perkiraan x~ karena kendala aritmatika terbatas, sehingga Ax~≈b , dalam arti yang sesuai. Apa yang diwakili oleh solusi Anda? Yah, itu mungkin solusi tepat untuk beberapa sistem lain seperti
A~x~=b~
Jadi agar x~ memiliki utilitas, sistem tilde harus dekat dengan sistem asli:
A~≈A,b~≈b
Jikaalgoritme Andamenyelesaikan sistem asli memenuhi properti itu, maka itu disebut sebagaibackward stable. Sekarang, analisis yang akurat tentang seberapa besar perbedaanA~−A ,b~−b akhirnya mengarah pada kesalahan pada batas yang dinyatakan sebagai∥A~−A∥ ,∥b~−b∥ . Untuk beberapa analisis,normal1 (jumlah kolom maks) adalah yang termudah untuk didorong, bagi yang lain,l∞ norma (max baris sum) adalah yang paling mudah untuk mendorong melalui (untuk komponen dari solusi dalam kasus sistem linear, misalnya), dan untuk yang lain lagi, yangl2 norma spektral adalah yang paling sesuai satu (yang disebabkan oleh tradisionall2 norma vektor, seperti yang ditunjukkandalam jawaban lain). Untuk kuda kerja komputasi statistik dalam inversi matriks psd simetris,dekomposisi Cholesky(trivia: bunyi pertama adalah [x] seperti dalam huruf Yunani "chi", bukan [tʃ] seperti dalam "chase"), norma yang paling nyaman untuk digunakan. melacak batas-batas kesalahan adalahl2 norma ... meskipun norma Frobenius juga muncul dalam beberapa hasil misalnya pada dipartisi matriks inversi.
sumber
Jawaban untuk ini tergantung pada bidang Anda. Jika Anda seorang ahli matematika, maka semua norma dalam dimensi hingga adalah setara : untuk dua norma dan ‖ ⋅ ‖ b , ada konstanta C 1 , C 2 , yang hanya bergantung pada dimensi (dan a, b) sedemikian rupa sehingga:∥⋅∥a ∥⋅∥b C1,C2
Ini menyiratkan bahwa norma-norma dalam dimensi yang terbatas cukup membosankan dan pada dasarnya tidak ada perbedaan di antara mereka kecuali dalam bagaimana mereka berskala. Ini biasanya berarti bahwa Anda dapat memilih norma yang paling sesuai untuk masalah yang Anda coba selesaikan . Biasanya Anda ingin menjawab pertanyaan seperti "apakah operator atau prosedur ini dibatasi" atau "apakah proses numerik ini menyatu." Dengan keterbatasan, Anda biasanya hanya peduli bahwa ada sesuatu yang terbatas. Dengan konvergensi, dengan mengorbankan tingkat konvergensi, Anda dapat memilih untuk menggunakan norma yang lebih nyaman.
Misalnya, dalam aljabar linear numerik, norma Frobenius kadang-kadang lebih disukai karena jauh lebih mudah untuk dihitung daripada norma euclidean, dan juga bahwa itu secara alami terhubung dengan kelas yang lebih luas dari operator Hilbert Schmidt . Juga, seperti norma Euclidean, ini bersifat submultiplictive: , tidak seperti katakanlah, norma maks, sehingga memungkinkan Anda untuk dengan mudah berbicara tentang penggandaan operator di ruang mana pun Anda bekerja. Orang-orang cenderung sangat menyukai keduanya p = 2∥AB∥F≤∥A∥F∥B∥F p=2 norma dan norma Frobenius karena mereka memiliki hubungan alami baik dengan nilai eigen dan nilai singular dari matriks, bersama dengan menjadi bersifat subyektif.
Untuk tujuan praktis , perbedaan antara norma menjadi lebih jelas karena kita hidup di dunia dimensi dan biasanya penting seberapa besar kuantitas tertentu, dan bagaimana hal itu diukur. Mereka konstanta di atas tidak persis ketat, sehingga menjadi penting berapa banyak lebih atau kurang norma tertentu ‖ x ‖ sebuah dibandingkan dengan ‖ x ‖ b .C1,C2 ∥x∥a ∥x∥b
sumber