Bagaimana cara membuktikan bahwa fungsi basis radial adalah sebuah kernel?

35

Bagaimana untuk membuktikan bahwa fungsi dasar radial k(x,y)=exp(||xy||2)2σ2)adalah sebuah kernel? Sejauh yang saya mengerti, untuk membuktikan ini kita harus membuktikan salah satu dari yang berikut:

  1. Untuk setiap set vektor x1,x2,...,xn matriks K(x1,x2,...,xn) = (k(xi,xj))n×n adalah semidefinite positif.

  2. Sebuah pemetaan Φ dapat disajikan seperti k(x,y) = Φ(x),Φ(y) .

Ada bantuan?

Leo
sumber
1
Untuk menghubungkannya dengan lebih jelas: peta fitur juga dibahas dalam pertanyaan ini , khususnya jawaban Marc Claesen berdasarkan seri Taylor dan milik saya yang membahas RKHS dan versi umum dari penyematan L2 diberikan oleh Douglas di bawah ini.
Dougal

Jawaban:

26

Metode Zen yang digunakan 1. Berikut adalah metode 2: Peta x ke distribusi Gaussian simetris bola yang berpusat di x di ruang Hilbert L2 . Deviasi standar dan faktor konstan harus diubah agar ini berfungsi dengan tepat. Misalnya, dalam satu dimensi,

exp[(xz)2/(2σ2)]2πσexp[(yz)2/(2σ2)2πσdz=exp[(xy)2/(4σ2)]2πσ.

Jadi, gunakan deviasi standar dan skala distribusi Gaussian untuk mendapatkank(x,y)=Φ(x),Φ(y). Rescaling terakhir ini terjadi karenaL2norma dari distribusi normal tidak1pada umumnya.σ/2k(x,y)=Φ(x),Φ(y)L21

Douglas Zare
sumber
2
@ Zen, Douglas Zare: terima kasih atas jawaban Anda yang luar biasa. Bagaimana saya bisa memilih jawaban resmi sekarang?
Leo
23

Saya akan menggunakan metode 1. Periksa jawaban Douglas Zare untuk bukti menggunakan metode 2.

Saya akan membuktikan kasus ketika adalah bilangan real, sehingga k ( x , y ) = exp ( - ( x - y ) 2 / 2 σ 2 ) . Kasus umum mengikuti mutatis mutandis dari argumen yang sama, dan layak dilakukan.x,yk(x,y)=exp((xy)2/2σ2)

Tanpa kehilangan sifat umum, anggaplah bahwa .σ2=1

Tulis , di mana h ( t ) = exp ( - t 2k(x,y)=h(xy)adalah fungsi karakteristik dari variabel acakZdengandistribusiN(0,1).

h(t)=exp(t22)=E[eitZ]
ZN(0,1)

x1,,xna1,,an

j,k=1najakh(xjxk)=j,k=1najakE[ei(xjxk)Z]=E[j,k=1najeixjZakeixkZ]=E[|j=1najeixjZ|2]0,
k

Untuk memahami hasil ini secara umum, lihat Teorema Bochner: http://en.wikipedia.org/wiki/Positive-definite_function

Zen
sumber
2
h(t)xy
1
Tks! Saya sedang terburu-buru di sini. :-)
Zen
1
h
23

Xφ

  • κγκγ>0

    φκγφγκ

  • κ1κ2κ1+κ2

    φ1φ2x[φ1(x)φ2(x)]

  • κ1,κ2,κ(x,y):=limnκn(x,y)x,yκ

    Bukti: Untuk setiap dan setiap kita memilikinya . Mengambil batas sebagai memberikan properti yang sama untuk .m,n1{(xi,ci)}i=1mX×Ri=1mciκn(xi,xj)cj0nκ

  • Produk: Jika dan adalah kernel pd, demikian juga .κ1κ2g(x,y)=κ1(x,y)κ2(x,y)

    Bukti: Ini mengikuti langsung dari teorema produk Schur , tetapi Schölkopf dan Smola (2002) memberikan bukti dasar yang bagus berikut ini. Biarkan independen. Dengan demikian Matriks kovarian harus psd, jadi pertimbangkan matriks kovarian dari membuktikannya.

    (V1,,Vm)N(0,[κ1(xi,xj)]ij)(W1,,Wm)N(0,[κ2(xi,xj)]ij)
    Cov(ViWi,VjWj)=Cov(Vi,Vj)Cov(Wi,Wj)=κ1(xi,xj)κ2(xi,xj).
    (V1W1,,VnWn)
  • Powers: Jika adalah kernel pd, demikian juga untuk bilangan bulat positif .κκn(x,y):=κ(x,y)nn

    Bukti: langsung dari properti "produk".

  • Eksponen: Jika adalah kernel pd, maka adalah .κeκ(x,y):=exp(κ(x,y))

    Bukti: Kami memiliki ; gunakan properti "kekuatan", "skala", "jumlah", dan "batas".eκ(x,y)=limNn=0N1n!κ(x,y)n

  • Fungsi: Jika adalah kernel pd dan , juga.κf:XRg(x,y):=f(x)κ(x,y)f(y)

    Bukti: Gunakan peta fitur .xf(x)φ(x)

Sekarang, perhatikan bahwa Mulai dengan kernel linear , terapkan "skala" dengan , terapkan "eksponen", dan terapkan "fungsi" dengan .

k(x,y)=exp(12σ2xy2)=exp(12σ2x2)exp(1σ2xTy)exp(12σ2y2).
κ(x,y)=xTy1σ2xexp(12σ2x2)
Dougal
sumber