Seorang rekan memiliki fungsi dan untuk tujuan kita itu adalah kotak hitam. Fungsi mengukur kesamaan dari dua objek.s ( a , b )
Kami tahu pasti bahwa memiliki sifat-sifat ini:
- Skor kesamaan adalah bilangan real antara 0 dan 1, inklusif.
- Hanya objek yang identik sendiri memiliki skor 1. Jadi menyiratkan , dan sebaliknya.a = b
- Kami dijamin .
Sekarang dia ingin bekerja dengan algoritma yang membutuhkan jarak sebagai input, dan bergantung pada input yang memuaskan aksioma jarak.
Pikir saya adalah bahwa kita dapat memperlakukan skor kesamaan seolah-olah mereka adalah hasil dari kernel RBF dengan jarak tertentu (itu bisa menjadi norma Euclidean atau jarak lain), yaitu kita bisa mengatur ulang dengan aljabar dan menganggap bahwa skor kesamaan mengacu pada kernel RBF untuk sepasang poin dalam beberapa sistem koordinat (tidak diketahui).
Di mana adalah beberapa vektor yang tidak diketahui, dan x α adalah objek yang menarik dan d adalah jarak tertentu.
Sifat-sifat yang jelas berhasil, dalam hal menghormati aksioma jarak. Hasilnya harus non-negatif, dan jarak hanya 0 untuk objek yang identik. Tetapi tidak jelas bahwa rangkaian keadaan yang agak umum ini cukup untuk menyiratkan bahwa ketimpangan segitiga dihormati.
Di sisi lain, ini terdengar agak gila.
Jadi pertanyaan saya adalah "apakah ada sehingga f ( s ( a , b ) ) = d ( a , b ) untuk metrik jarak diberikan properti ini pada s , dan apa itu f ?"
Jika tidak ada dalam keadaan umum ini pada s , apakah ada seperangkat persyaratan tambahan yang f ada?
sumber
Jawaban:
Tidak dalam semua kasus.
Wikipedia: "Dalam matematika, khususnya analisis fungsional, teorema Mercer adalah representasi dari fungsi definitif positif simetris pada bujur sangkar sebagai jumlah dari urutan konvergen fungsi produk. Teorema ini, yang disajikan dalam (Mercer 1909), adalah salah satu dari hasil yang paling menonjol dari karya James Mercer.Ini adalah alat teoretis yang penting dalam teori persamaan integral, digunakan dalam teori ruang proses proses stokastik Hilbert, misalnya teorema Karhunen-Loève, dan juga digunakan untuk mengkarakterisasi kernel semi-pasti positif simetris.
Ini adalah ' pemetaan banyak ke satu ' pada ruang Hilbert . - sebuah kotor penyederhanaan akan menggambarkannya sebagai hash atau checksum yang Anda dapat menguji terhadap file untuk menentukan identitas atau tidak.
Penjelasan lebih teknis: teorema disintegrasi
"Dalam matematika, teorema disintegrasi adalah hasil dari teori ukuran dan teori probabilitas. Teori ini secara ketat mendefinisikan ide " pembatasan "non-sepele dari ukuran untuk mengukur nol subset dari ruang ukuran yang bersangkutan. Hal ini terkait dengan keberadaan ukuran probabilitas bersyarat. Dalam arti tertentu, "disintegrasi" adalah proses yang berlawanan dengan konstruksi ukuran produk. ".
Lihat juga: " Teorema Fubini-Tonelli ", " Hinge Loss ", " Loss Function ", dan " Seberapa Baik Kernel Saat Digunakan sebagai Ukuran Kesamaan? " (Juni 2007) oleh Nathan Srebro, abstrak:
" Abstrak. Baru-baru ini, Balcan dan Blum menyarankan teori pembelajaran berdasarkan fungsi kesamaan umum, alih-alih kernel semi-pasti positif. Kami mempelajari kesenjangan antara jaminan pembelajaran berdasarkan pembelajaran berbasis kernel, dan teori yang dapat diperoleh dengan menggunakan kernel sebagai fungsi kesamaan, yang dibiarkan terbuka oleh Balcan dan Blum. Kami memberikan ikatan yang ditingkatkan secara signifikan pada seberapa baik fungsi kernel ketika digunakan sebagai fungsi kesamaan, dan memperluas hasilnya juga ke engsel-loss yang lebih relevan secara praktis, bukan kemudian zero-one-error-rate. Selanjutnya, kami menunjukkan bahwa ikatan ini ketat, dan karenanya menetapkan bahwa sebenarnya ada kesenjangan nyata antara gagasan margin berbasis kernel tradisional dan gagasan berbasis kesamaan yang lebih baru. "
Lihat: kernel dan kesamaan (dalam R)
Ini adalah kotak hitam sehingga Anda tidak tahu pasti kernel mana yang digunakan, apakah itu berbasis kernel, dan Anda tidak tahu detail implementasi kernel begitu Anda berpikir Anda tahu yang mana. Lihat: Persamaan rbfKernel di kernlab berbeda dari standar? .
Ini cepat dan efektif, dalam keadaan yang terbatas. Seperti palu, jika Anda membawa palu Anda akan orang-orang memanggil Anda gila?
" Metode kernel berutang nama mereka untuk penggunaan fungsi kernel, yang memungkinkan mereka untuk beroperasi dalam ruang fitur, dimensi tinggi implisit tanpa pernah menghitung koordinat data dalam ruang itu, melainkan dengan hanya menghitung produk dalam antara gambar dari semua pasangan data dalam ruang fitur. Operasi ini sering kali secara komputasi lebih murah daripada perhitungan eksplisit dari koordinat. Pendekatan ini disebut "trik kernel". Fungsi kernel telah diperkenalkan untuk data urutan, grafik, teks, gambar, sebagai serta vektor. "
Pelajaran: Anda (terkadang) mendapatkan apa yang Anda bayar.
Banyak, lihat tautan di atas, " Fungsi Kernel Populer ", RBF , dan inilah satu contoh (mahal): " Ukuran Jarak Rasio Kemungkinan untuk Kesamaan Antara Fourier Transform of Time Series " (2005), oleh Janacek, Bagnall dan Powell.
Ruang dan metode yang berbeda dapat lebih baik menargetkan perbandingan (dan disintegrasi) dari masalah tertentu, ada banyak metode untuk ruang Hilbert saja.
Ya, daftarnya besar, lihat tautan di atas dan (untuk satu contoh): Mereproduksi ruang kernel Hilbert .
sumber
sumber