Mengapa norma matriks default adalah norma spektral dan bukan norma Frobenius?

17

Untuk norma vektor, norma L2 atau "Euclidean distance" adalah definisi yang banyak digunakan dan intuitif. Tetapi mengapa definisi norma "paling sering digunakan" atau "standar" untuk sebuah matriks adalah norma spektral , tetapi bukan norma Frobenius (yang mirip dengan norma L2 untuk vektor)?

Apakah itu ada hubungannya dengan algoritma iteratif / kekuatan matriks (jika jari-jari spektrum lebih kecil dari 1, maka algoritme akan menyatu)?


  1. Itu selalu bisa diperdebatkan untuk kata-kata seperti "paling sering digunakan", "default". Kata "default" yang disebutkan di atas berasal dari tipe pengembalian default dalam Matlabfungsi norm. Dalam Rnorma default untuk matriks adalah norma L1. Keduanya "tidak alami" bagi saya (untuk matriks, tampaknya lebih "alami" untuk dilakukan i,jai,j2 seperti dalam vektor). (Terima kasih atas komentar @ usεr11852 dan @ whuber dan maaf atas kebingungannya.)

  2. Mungkin memperluas penggunaan norma matriks akan membantu saya untuk lebih mengerti?

Haitao Du
sumber
4
Saya tidak yakin bahwa norma spektral adalah yang paling banyak digunakan. Misalnya norma Frobenius digunakan untuk NNMF dan biasanya ketika mendekati solusi untuk mengoreksi / matriks kovarian yang bukan Pos.Def. dan diatur untuk menjadi Pos. Def. Secara umum norma Forbenius adalah norma "unsur-bijaksana" per se sedangkan norma spektral didasarkan pada nilai eigen sehingga sedikit lebih "universal" tetapi ini adalah masalah pendapat. Misalnya " Matriks Aljabar " Gentle secara harfiah memiliki bab bernama: " Norma Frobenius - Norma" Biasa ". Jadi jelas norma spektral bukanlah norma standar untuk semua.
usεr11852 mengatakan Reinstate Monic
2
L2L2||A||2=max||x||2=1||Ax||2norm
3
Saya tidak setuju bahwa standarnya adalah Euclidian, dan yang paling umum digunakan adalah Spectral.
Aksakal
5
Saya bingung dengan pertanyaan ini karena saya tidak bisa melihat bagaimana norma-norma matriks adalah masalah preferensi atau penggunaan. Jika satu norma tertentu relevan dengan masalah, maka itu digunakan; jika yang lain relevan, maka itu digunakan. Tanpa masalah atau aplikasi yang jelas dalam pikiran, maka, saya tidak dapat melihat bagaimana pertanyaan ini dapat dijawab.
whuber
5
@ usεr11852 Terima kasih telah menunjukkannya. Penting bahwa teks pertanyaan menyertakan semua informasi tersebut. Jangan mengandalkan orang yang membaca komentar, terutama ketika ada banyak dari mereka. Kebetulan, halaman bantuan untuk "norma {basis}" di salinan Rdaftar saya norma sebagai default, bukan norma spektral. L1
whuber

Jawaban:

13

Secara umum, saya tidak yakin bahwa norma spektral adalah yang paling banyak digunakan. Misalnya norma Frobenius digunakan untuk memperkirakan solusi pada factorisation matriks non-negatif atau korelasi / kovarians matriks regularisasi . Saya pikir bagian dari pertanyaan ini bermula dari kesalahan istilah yang dilakukan sebagian orang (termasuk saya sendiri) ketika merujuk pada norma Frobenius sebagai norma matriks Euclidean . Kita tidak boleh karena sebenarnya norma matriks (yaitu. Norma spektral) adalah salah satu yang diinduksi ke matriks ketika menggunakan norma vektor L 2 . Norma Frobenius adalah elemen-bijaksana: | | A | |L2L2 , sedangkannorma matriksL2(||A||2=||A||F=i,jai,j2L2) didasarkan pada nilai singular sehingga lebih "univeral". (untuk keberuntungan istilah yang lebih baik?)Norma matriksL2adalah norma tipe Euclidean karena diinduksi oleh norma vektor Euclidean, di mana| | A| | 2=maks | | x | | 2 = 1 | | Ax| | 2. Oleh karena itu itu merupakannorma yang diinduksiuntuk matriks karenadiinduksioleh a||A||2=λmax(ATA))L2||A||2=max||x||2=1||Ax||2norma vektor , norma vektor dalam hal ini.L2

Mungkin MATLAB bertujuan untuk menyediakan norma secara default saat menggunakan perintah ; sebagai konsekuensinya ia menyediakan Euclidean vektor norma tetapi juga L 2 matriks norma, yaitu. yang spektral matriks norma (daripada salah dikutip " Frobenius / Euclidean matrix norma "). Akhirnya izinkan saya mencatat bahwa apa yang merupakan norma standar adalah masalah pendapat untuk beberapa hal: Misalnya " Aljabar Matriks - Teori, Komputasi, dan Aplikasi JE Gentle " secara harfiah memiliki bab (3.9.2) bernama: " The Frobenius Norma - Norma “Biasa”L2normL2"; begitu jelas norma spektral bukanlah norma default untuk semua pihak yang dipertimbangkan! :) Seperti yang dikomentari oleh @amoeba, komunitas yang berbeda mungkin memiliki konvensi terminologi yang berbeda. Tak perlu dikatakan bahwa saya pikir buku Gentle adalah sumber daya yang tak ternilai dalam hal Aplikasi Aljabar Lin dalam Statistik dan saya akan meminta Anda untuk melihatnya lebih jauh!

usεr11852 kata Reinstate Monic
sumber
1
jawaban bagus !! membantu saya! A2=maxx2=1Ax2
Haitao Du
Saya senang bisa membantu. Harap perhatikan jawaban lain yang disediakan juga. Mereka cukup berwawasan luas.
usεr11852 mengatakan Reinstate Monic
8

Sebagian dari jawabannya mungkin terkait dengan komputasi numerik.

Ketika Anda memecahkan sistem

Ax=b
dalam ketepatan terbatas, Anda tidak mendapatkan jawaban yang tepat untuk masalah itu. Anda mendapatkan perkiraan x~ karena kendala aritmatika terbatas, sehingga Ax~b , dalam arti yang sesuai. Apa yang diwakili oleh solusi Anda? Yah, itu mungkin solusi tepat untuk beberapa sistem lain seperti
A~x~=b~
Jadi agar x~ memiliki utilitas, sistem tilde harus dekat dengan sistem asli:
A~A,b~b
Jikaalgoritme Andamenyelesaikan sistem asli memenuhi properti itu, maka itu disebut sebagaibackward stable. Sekarang, analisis yang akurat tentang seberapa besar perbedaanA~A,b~bakhirnya mengarah pada kesalahan pada batas yang dinyatakan sebagaiA~A,b~b. Untuk beberapa analisis,normal1(jumlah kolom maks) adalah yang termudah untuk didorong, bagi yang lain,l norma (max baris sum) adalah yang paling mudah untuk mendorong melalui (untuk komponen dari solusi dalam kasus sistem linear, misalnya), dan untuk yang lain lagi, yangl2 norma spektral adalah yang paling sesuai satu (yang disebabkan oleh tradisionall2 norma vektor, seperti yang ditunjukkandalam jawaban lain). Untuk kuda kerja komputasi statistik dalam inversi matriks psd simetris,dekomposisi Cholesky(trivia: bunyi pertama adalah [x] seperti dalam huruf Yunani "chi", bukan [tʃ] seperti dalam "chase"), norma yang paling nyaman untuk digunakan. melacak batas-batas kesalahan adalahl2 norma ... meskipun norma Frobenius juga muncul dalam beberapa hasil misalnya pada dipartisi matriks inversi.

Tugas
sumber
3
+1, khususnya untuk hal-hal sepele. Saya selalu berpikir itu dimulai dengan [k]. Saya mencarinya sekarang dan ternyata André-Louis Cholesky adalah orang Polandia yang layak (lahir di Prancis). Tidakkah seharusnya itu "sh" terdengar, seperti di Chopin? Namun, dalam bahasa Rusia Cholesky memang secara tradisional ditulis sebagai Холецкий.
Amuba mengatakan Reinstate Monica
3
Saya ambil kembali. Ternyata ayah Chopin adalah orang Prancis, oleh karena itu pengucapan Perancis dari nama keluarga. Tetapi orang tua Cholesky adalah orang Polandia dan dalam bahasa Polandia seharusnya dilafalkan dengan [ ]. Bersulang. χ
Amuba kata Reinstate Monica
Ya ... Saya mengira itu sebagai orang Rusia dengan nama depan Polandia, dan setelah membaca ejaan Rusia itu sekitar satu dekade sebelum pertama kali melihatnya dieja dalam huruf Latin, saya punya ide bagaimana cara mengucapkannya;)
StasK
2
Siapa yang peduli bagaimana cara mengucapkannya, cukup gunakan benda sialan itu.
Mark L. Stone
7

Jawaban untuk ini tergantung pada bidang Anda. Jika Anda seorang ahli matematika, maka semua norma dalam dimensi hingga adalah setara : untuk dua norma dan b , ada konstanta C 1 , C 2 , yang hanya bergantung pada dimensi (dan a, b) sedemikian rupa sehingga:ab C1,C2

C1xbxaC2xb.

Ini menyiratkan bahwa norma-norma dalam dimensi yang terbatas cukup membosankan dan pada dasarnya tidak ada perbedaan di antara mereka kecuali dalam bagaimana mereka berskala. Ini biasanya berarti bahwa Anda dapat memilih norma yang paling sesuai untuk masalah yang Anda coba selesaikan . Biasanya Anda ingin menjawab pertanyaan seperti "apakah operator atau prosedur ini dibatasi" atau "apakah proses numerik ini menyatu." Dengan keterbatasan, Anda biasanya hanya peduli bahwa ada sesuatu yang terbatas. Dengan konvergensi, dengan mengorbankan tingkat konvergensi, Anda dapat memilih untuk menggunakan norma yang lebih nyaman.

Misalnya, dalam aljabar linear numerik, norma Frobenius kadang-kadang lebih disukai karena jauh lebih mudah untuk dihitung daripada norma euclidean, dan juga bahwa itu secara alami terhubung dengan kelas yang lebih luas dari operator Hilbert Schmidt . Juga, seperti norma Euclidean, ini bersifat submultiplictive: , tidak seperti katakanlah, norma maks, sehingga memungkinkan Anda untuk dengan mudah berbicara tentang penggandaan operator di ruang mana pun Anda bekerja. Orang-orang cenderung sangat menyukai keduanya p = 2ABFAFBFp=2 norma dan norma Frobenius karena mereka memiliki hubungan alami baik dengan nilai eigen dan nilai singular dari matriks, bersama dengan menjadi bersifat subyektif.

Untuk tujuan praktis , perbedaan antara norma menjadi lebih jelas karena kita hidup di dunia dimensi dan biasanya penting seberapa besar kuantitas tertentu, dan bagaimana hal itu diukur. Mereka konstanta di atas tidak persis ketat, sehingga menjadi penting berapa banyak lebih atau kurang norma tertentu x sebuah dibandingkan dengan x b .C1,C2xaxb

Alex R.
sumber
7
n
@ MarkL.Stone: Benar, maka perbedaan antara teoretis (benar-benar: topologis) dan praktis.
Alex R.
@ MarkL.Stone: +1 Jelas dia tidak menguji unit kode-nya. :) (Anekdot yang bagus! Saya pasti akan menggunakannya ketika berbicara tentang miskomunikasi dalam komputasi teknis!)
usεr11852 mengatakan Reinstate Monic
@ usεr11852 ha ha, tidak, ini lebih buruk dari itu. Dia melakukan "unit-test" kode dengan benar menerapkan perhitungan berdasarkan norma 1. Itu gagal dalam ujian tingkat sistem saya karena menggunakan norma yang salah.
Mark L. Stone
@ MarkL.Stone: Oh ... sayang sekali! Karena itu, saya tidak tahu apakah Anda menggunakan konfigurasi perangkat keras tertentu atau sesuatu tetapi untuk memulai dengan pengkodean perhitungan norma dari awal tidak-tidak; ada perpustakaan matematika yang harus digunakan untuk menghindari masalah seperti itu sama sekali.
usεr11852 mengatakan Reinstate Monic