Definisi splines kubik alami untuk regresi

16

Saya belajar tentang splines dari buku "Elemen-elemen Pembelajaran Statistik, Penambangan, Inferensi, dan Prediksi" oleh Hastie et al. Saya menemukan pada halaman 145 bahwa splines kubik alami adalah linier di luar simpul batas. Ada K knot, ξ1,ξ2,...ξK dalam splines dan berikut ini diberikan tentang spline tersebut dalam buku.masukkan deskripsi gambar di sini

Pertanyaan 1: Bagaimana kebebasan 4 derajat dibebaskan? Saya tidak mendapatkan bagian ini.

Pertanyaan 2 : Dalam definisi ketika k = K maka d K ( X ) = 0dk(X)k=K . Apa yang penulis coba lakukan dalam formula ini? Bagaimana ini membantu memastikan bahwa splines linier di luar simpul batas?dK(X)=00

Durin
sumber

Jawaban:

17
  1. Mari kita mulai dengan mempertimbangkan splines kubik biasa. Mereka kubik antara setiap pasangan simpul dan kubik di luar simpul batas. Kita mulai dengan 4df untuk kubik pertama (kiri dari simpul batas pertama), dan masing-masing simpul menambahkan satu parameter baru (karena kontinuitas kubik dan turunannya dan turunan kedua menambahkan tiga kendala, meninggalkan satu parameter bebas), menjadikan total Parameter untuk simpul K.K+4K

    Spline kubik alami linear pada kedua ujungnya. Ini kendala bagian kubik dan kuadrat sana untuk 0, masing-masing mengurangi df dengan 1. Itu 2 df di masing-masing dua ujung kurva, mengurangi untuk K .K+4K

    Bayangkan Anda memutuskan Anda dapat menghabiskan sejumlah derajat kebebasan ( , katakanlah) pada perkiraan kurva non-parametrik Anda. Karena memaksakan spline alami menggunakan 4 derajat kebebasan yang lebih rendah daripada spline kubik biasa (untuk jumlah simpul yang sama), dengan parameter p tersebut Anda dapat memiliki 4 simpul lebih (dan 4 parameter lainnya) untuk memodelkan kurva antara simpul batas .pp

  2. Perhatikan bahwa definisi untuk adalah untuk k = 1 , 2 , . . . , K - 2 (karena ada fungsi dasar K dalam semua). Jadi fungsi dasar terakhir dalam daftar itu, N K = d K - 2 - d K - 1 . Jadi tertinggi k dibutuhkan untuk definisi d k adalah untuk k = K - 1Nk+2k=1,2,...,K2KNK=dK2dK1kdkk=K1. (Artinya, kita tidak perlu mencoba untuk mencari tahu apa yang beberapa mungkin dilakukan, karena kita tidak menggunakannya.)dK

Glen_b -Reinstate Monica
sumber
4

Saya merinci pernyataan: "Ini membebaskan empat derajat kebebasan (masing-masing dua kendala di kedua wilayah perbatasan)" dalam contoh dengan simpul ξ 1 , ξ 2 . Interval yang terkait adalah ] - , ξ 1 [ , ] ξ 1 , ξ 2 [ dan ] ξ 2 , + [ (jadi ada | I | = 3 interval dan | I | - 1 = 22ξ1,ξ2],ξ1[]ξ1,ξ2[]ξ2,+[|I|=3|I|1=2 knot).

Untuk splines kubik (umum)

Tanpa kendala keteraturan, kami memiliki persamaan:4|I|=12

1 ( ξ 1X < ξ 2 ) ; 1 ( ξ 1X < ξ 2 ) X ; 1

1(X<ξ1)  ;  1(X<ξ1)X  ;  1(X<ξ1)X2  ;  1(X<ξ1)X3  ;
1(ξ1X<ξ2)  ;  1(ξ1X<ξ2)X  ;  1(ξ1X<ξ2)X2  ;  1(ξ1X<ξ2)X3  ;
1(ξ2X)  ;  1(ξ2X)X  ;  1(ξ2X)X2  ;  1(ξ2X)X3.

Crr=2(r+1)×(|I|1)=3×(|I|1)=6

126=6

Untuk splines kubik alami

"Sebuah splines kubik alami menambah kendala tambahan, yaitu fungsi itu linier di luar simpul batas."

4|I|4=12442

1(X<ξ1)  ;  1(X<ξ1)X  ;  
1(ξ1X<ξ2)  ;  1(ξ1X<ξ2)X  ;  1(ξ1X<ξ2)X2  ;  1(ξ1X<ξ2)X3  ;
1(ξ2X)  ;  1(ξ2X)X.

3×(|I|1)=6

86=2

ahstat
sumber