ℓp adalah fungsi yang mengambil vektor dan mengembalikan nomor non-negatif. Mereka didefinisikan sebagai Dalam kasus di mana p = 2 , ini adalah disebut norma Euclidean . Anda dapat mendefinisikan jarak Euclidean sebagai \ | \ vec x - \ vec y \ | _2 . Ketika p = \ infty , ini berarti \ | \ vec x \ | _ \ infty = \ sup_i x_i (atau \ max_i x_i ). Sebenarnya, p harus setidaknya satu untuk \ | \ vec x \ | _p menjadi norma . Jika 0 <p <1 , maka \ | \ vec x \ | _p p = 2
∥x⃗ ∥p=(∑i=1d|xi|p)1/p
p=2∥x⃗ −y⃗ ∥2p=∞∥x⃗ ∥∞=supiximaxixip∥x⃗ ∥p0<p<1∥x⃗ ∥p sebenarnya bukan norma, karena norma harus memenuhi ketimpangan segitiga.
(Ada juga norma , yang didefinisikan secara analagous, kecuali untuk fungsi alih-alih vektor atau urutan - sungguh ini adalah hal yang sama, karena vektor adalah fungsi dengan domain yang terbatas.)Lp
Saya tidak mengetahui adanya penggunaan untuk norma dalam aplikasi pembelajaran mesin di mana , kecuali di mana . Biasanya Anda melihat atau , atau kadang-kadang mana Anda ingin bersantai ; tidak sepenuhnya cembung di , tetapi adalah, untuk . Ini dapat membuat mencari solusi "lebih mudah" dalam kasus-kasus tertentu.p>2p=∞p=2p=11<p<2p=1∥x⃗ ∥1x⃗ ∥x⃗ ∥p1<p<∞
Dalam konteks regularisasi, jika Anda menambahkan ke fungsi tujuan Anda, apa yang Anda katakan adalah bahwa Anda berharap menjadi jarang , artinya, sebagian besar terdiri dari nol. Ini agak teknis, tetapi pada dasarnya, jika ada solusi padat , kemungkinan ada solusi sparser dengan norma yang sama. Jika Anda mengharapkan solusi Anda menjadi padat, Anda dapat menambahkan ke tujuan Anda, karena itu lebih mudah untuk bekerja dengan turunannya. Keduanya melayani tujuan menjaga solusi dari memiliki berat badan terlalu banyak.∥x⃗ ∥1x⃗ ∥x⃗ ∥22
Norma campuran muncul ketika Anda mencoba mengintegrasikan beberapa sumber. Pada dasarnya Anda ingin vektor solusi terdiri dari beberapa bagian , di mana adalah indeks dari beberapa sumber. The norma hanyalah -norm dari semua -norms dikumpulkan dalam vektor. Yaitu,x⃗ jjℓp,qqp
∥x⃗ ∥p,q=⎛⎝∑j=1m(∑i=1d|xji|p)q/p⎞⎠1/q
Tujuan dari ini bukan untuk "melebih-lebihkan" seperangkat solusi, katakanlah dengan menggunakan . Potongan-potongan individual jarang, tetapi Anda tidak mengambil risiko nuking seluruh vektor solusi dengan mengambil -norm dari semua solusi. Jadi Anda menggunakan -norm di luar sebagai gantinya.∥x⃗ ∥1,212
Semoga itu bisa membantu.
Lihat makalah ini untuk lebih jelasnya.