TLDR: Apakah splines regresi plat tipis memiliki interpretasi probabilistik / Bayesian?
Pasangan input-output yang diberikan , ; Saya ingin memperkirakan fungsi sebagai berikut
mana adalah fungsi kernel dan adalah vektor fitur dengan ukuran . Koefisien dan dapat ditemukan dengan menyelesaikan
mana baris \ Phi diberikan oleh(xsaya,ysaya)(xi,yi)saya=1,...,ni=1,...,nf(⋅)f(⋅)f(x)≈kamu(x)=ϕ(xsaya)Tβ+n∑saya=1αsayak(x,xsaya),
f(x)≈u(x)=ϕ(xi)Tβ+∑i=1nαik(x,xi),
k(⋅,⋅)k(⋅,⋅)ϕ(xsaya)ϕ(xi)m<nm<nαsayaαiβsayaβiminα∈Rn,β∈Rm1n‖Y−Φβ−Kα‖2Rn+λαTKα,minα∈Rn,β∈Rm1n∥Y−Φβ−Kα∥2Rn+λαTKα,
ΦΦϕ(xi)Tϕ(xi)T dan, dengan beberapa penyalahgunaan notasi, entri
i,ji,j dari matriks kernel
KK adalah
k(xi,xj)k(xi,xj) . Ini memberi
α∗=λ−1(I+λ−1K)−1(Y−Φβ∗)α∗=λ−1(I+λ−1K)−1(Y−Φβ∗)
β∗={ΦT(I+λ−1K)−1Φ}−1ΦT(I+λ−1K)−1Y.β∗={ΦT(I+λ−1K)−1Φ}−1ΦT(I+λ−1K)−1Y.
Dengan asumsi bahwa
k(⋅,⋅)k(⋅,⋅) adalah fungsi kernel pasti positif, solusi ini dapat dilihat sebagai Prediktor Linier Tidak Linier Terbaik untuk model Bayesian berikut:
y | (β,h(⋅)) ∼ N(ϕ(x)β+h(x),σ2),y | (β,h(⋅)) ∼ N(ϕ(x)β+h(x),σ2),
h(⋅) ∼ GP(0,τk(⋅,⋅)),h(⋅) ∼ GP(0,τk(⋅,⋅)),
β∝1,β∝1,
di mana
σ2/τ=λσ2/τ=λ dan
GPGP menunjukkan proses Gaussian. Lihat misalnya
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2665800/
Pertanyaan saya adalah sebagai berikut. Misalkan saya membiarkan k(x,x′):=|x−x′|2ln(|x−x′|)k(x,x′):=|x−x′|2ln(|x−x′|) dan ϕ(x)T=(1,x)ϕ(x)T=(1,x) , yaitu spline pelat tipis regresi. Sekarang, k(⋅,⋅)k(⋅,⋅) bukan fungsi semidefinite positif dan interpretasi di atas tidak berfungsi. Apakah model di atas dan solusinya masih memiliki interpretasi probabilistik untuk kasus k(⋅,⋅)k(⋅,⋅) adalah semidefinite positif?
Jawaban:
Biarkan model pertanyaan ditulis sebagai mana adalah GP yang tidak teramati dengan indeks dan adalah istilah kebisingan normal dengan varians . GP biasanya diasumsikan berpusat, stasioner dan non-deterministik. Perhatikan bahwa istilah dapat dianggap sebagai GP (deterministik) dengan kernel manaYi=ϕ(xi)⊤β+h(xi)+εi
Berikut adalah dua contoh IRF untuk . Pertama, pertimbangkan proses Wiener dengan kondisi awalnya diganti dengan kondisi awal difus : normal dengan varian tak terbatas. Setelah nilai diketahui, IRF dapat diprediksi seperti halnya Wiener GP. Kedua, pertimbangkan proses Wiener terintegrasi yang diberikan oleh persamaan mana adalah proses Wiener. Untuk mendapatkan GP kita sekarang membutuhkan dua parameter skalar: dua nilai dan untukd=1d=1 ζ(x)ζ(x) ζ(0)=0ζ(0)=0 ζ(0)ζ(0) ζ(x)ζ(x) d2ζ(x)/dx2=dW(x)/dx
Untuk dimensi umum , pertimbangkan spasi linear dari fungsi yang didefinisikan pada . Kami menyebut kenaikan relatif ke koleksi terbatas lokasi dan bobot nyata sedemikian rupa sehingga Anggap sebagai ruang kosong dari contoh kita. Sebagai contoh pertama kita dapat mengambil contoh dengan dan sewenang-wenang dandd FF RdRd FF ss xi∈Rdxi∈Rd ss νiνi s∑i=1νiϕ(xi)=0 for all ϕ∈F.
Perhitungan prediksi IRF hampir sama dengan dalam pertanyaan, dengan digantikan oleh , tetapi dengan sekarang membentuk dasar . Batasan ekstra harus ditambahkan dalam masalah optimisasi, yang akan memberikan bahwa . Kita masih dapat menambahkan fungsi-fungsi basis lainnya yang tidak ada di jika diperlukan; ini akan memiliki efek menambahkan GP deterministik, katakan ke IRF k(x,x′)k(x,x′) g(x,x′)g(x,x′) ϕi(x)ϕi(x) FF Φ⊤α=0Φ⊤α=0 α⊤Kα≥0α⊤Kα≥0 FF ψ(x)⊤γψ(x)⊤γ ζ(x)ζ(x) di (2).
Spline pelat tipis bergantung pada bilangan bulat sehingga , ruang berisi polinomial dengan derajat rendah, dengan dimensi tergantung pada dan . Dapat ditunjukkan bahwa jika adalah fungsi berikut untuk lalu mendefinisikan wrt positif bersyarat positif . Konstruksi berhubungan dengan operator diferensialmm>2dFp(m)mdE(r)r≥0 E(r):={(−1)m+1+d/2r2m−dlogrd even,r2m−dd odd,
Cressie N Statistik untuk Data Spasial . Wiley 1993.
Mardia KV, Kent JT, Goodall CR dan Little JA. Kriging dan splines dengan informasi derivatif. Biometrika (1996), 83,1, hlm. 207-221.
Model Wahba G Spline untuk Data Observasional . SIAM 1990.
Wang, Y Smoothing Splines, Metode dan Aplikasi . Chapman and Hall, 2011.
sumber