Apa itu norma

12

Saya telah melihat banyak makalah tentang representasi jarang belakangan ini, dan kebanyakan dari mereka menggunakan norma dan melakukan beberapa minimisasi. Pertanyaan saya adalah, apa norma , dan norma campuran? Dan bagaimana mereka relevan dengan regularisasi?p p , qppp,q

Terima kasih

air
sumber

Jawaban:

13

p adalah fungsi yang mengambil vektor dan mengembalikan nomor non-negatif. Mereka didefinisikan sebagai Dalam kasus di mana p = 2 , ini adalah disebut norma Euclidean . Anda dapat mendefinisikan jarak Euclidean sebagai \ | \ vec x - \ vec y \ | _2 . Ketika p = \ infty , ini berarti \ | \ vec x \ | _ \ infty = \ sup_i x_i (atau \ max_i x_i ). Sebenarnya, p harus setidaknya satu untuk \ | \ vec x \ | _p menjadi norma . Jika 0 <p <1 , maka \ | \ vec x \ | _p p = 2

xp=(i=1d|xi|p)1/p
p=2xy2p=x=supiximaxixipxp0<p<1xp sebenarnya bukan norma, karena norma harus memenuhi ketimpangan segitiga.

(Ada juga norma , yang didefinisikan secara analagous, kecuali untuk fungsi alih-alih vektor atau urutan - sungguh ini adalah hal yang sama, karena vektor adalah fungsi dengan domain yang terbatas.)Lp

Saya tidak mengetahui adanya penggunaan untuk norma dalam aplikasi pembelajaran mesin di mana , kecuali di mana . Biasanya Anda melihat atau , atau kadang-kadang mana Anda ingin bersantai ; tidak sepenuhnya cembung di , tetapi adalah, untuk . Ini dapat membuat mencari solusi "lebih mudah" dalam kasus-kasus tertentu.p>2p=p=2p=11<p<2p=1x1xxp1<p<

Dalam konteks regularisasi, jika Anda menambahkan ke fungsi tujuan Anda, apa yang Anda katakan adalah bahwa Anda berharap menjadi jarang , artinya, sebagian besar terdiri dari nol. Ini agak teknis, tetapi pada dasarnya, jika ada solusi padat , kemungkinan ada solusi sparser dengan norma yang sama. Jika Anda mengharapkan solusi Anda menjadi padat, Anda dapat menambahkan ke tujuan Anda, karena itu lebih mudah untuk bekerja dengan turunannya. Keduanya melayani tujuan menjaga solusi dari memiliki berat badan terlalu banyak.x1xx22

Norma campuran muncul ketika Anda mencoba mengintegrasikan beberapa sumber. Pada dasarnya Anda ingin vektor solusi terdiri dari beberapa bagian , di mana adalah indeks dari beberapa sumber. The norma hanyalah -norm dari semua -norms dikumpulkan dalam vektor. Yaitu,xjjp,qqp

xp,q=(j=1m(i=1d|xij|p)q/p)1/q

Tujuan dari ini bukan untuk "melebih-lebihkan" seperangkat solusi, katakanlah dengan menggunakan . Potongan-potongan individual jarang, tetapi Anda tidak mengambil risiko nuking seluruh vektor solusi dengan mengambil -norm dari semua solusi. Jadi Anda menggunakan -norm di luar sebagai gantinya.x1,212

Semoga itu bisa membantu.

Lihat makalah ini untuk lebih jelasnya.

Josephine Moeller
sumber
1
+1 untuk penjelasan tentang norma campuran. Saya sendiri tidak pernah memahaminya.
Suresh Venkatasubramanian
(+1) Jawaban yang bagus. Selamat datang di CrossValidated, John!
MånsT