Saya tertarik untuk belajar (dan mengimplementasikan) suatu alternatif interpolasi polinomial.
Namun, saya mengalami kesulitan menemukan deskripsi yang baik tentang bagaimana metode ini bekerja, bagaimana mereka berhubungan, dan bagaimana mereka membandingkan.
Saya akan menghargai masukan Anda tentang pro / kontra / kondisi di mana metode atau alternatif ini akan berguna, tetapi beberapa referensi yang bagus untuk teks, slide, atau podcast akan cukup.
interpolation
splines
David LeBauer
sumber
sumber
Jawaban:
Regresi OLS dasar adalah teknik yang sangat baik untuk menyesuaikan fungsi dengan sekumpulan data. Namun, regresi sederhana hanya cocok dengan garis lurus yang konstan untuk seluruh rentang . Ini mungkin tidak sesuai untuk situasi tertentu. Misalnya, data terkadang menunjukkan hubungan yang melengkung . Hal ini dapat diatasi dengan cara mengembalikan Y ke transformasi X , f ( X ) . Transformasi yang berbeda dimungkinkan. Dalam situasi di mana hubungan antara X dan Y adalah monoton , tetapi terus berkurang, log berubahX Y X f( X) X Y dapat digunakan. Pilihan populer lainnya adalah menggunakan polinomial di mana istilah baru dibentuk dengan menaikkan ke serangkaian kekuatan (misalnya, X 2 , X 3 , dll.). Strategi ini mudah diterapkan, dan Anda dapat mengartikan kecocokan tersebut dengan memberi tahu Anda berapa banyak 'tikungan' yang ada di data Anda (di mana jumlah tikungan sama dengan daya tertinggi yang dibutuhkan minus 1). X X2 X3
Namun, regresi berdasarkan logaritma atau eksponen kovariat akan cocok secara optimal hanya ketika itu adalah sifat yang tepat dari hubungan yang sebenarnya. Sangat masuk akal untuk membayangkan bahwa ada hubungan lengkung antara dan Y yang berbeda dari kemungkinan yang mampu dihasilkan oleh transformasi. Jadi, kita sampai pada dua strategi lain. Pendekatan pertama adalah loess , serangkaian regresi linier tertimbang yang dihitung pada jendela bergerak. Pendekatan ini lebih tua, dan lebih cocok untuk analisis data eksplorasi .X Y
Pendekatan lain adalah dengan menggunakan splines. Di itu sederhana, spline adalah istilah baru yang berlaku untuk hanya sebagian dari berbagai . Misalnya, X dapat berkisar dari 0 hingga 1, dan istilah spline mungkin hanya berkisar dari 0,7 hingga 1. Dalam hal ini, 0,7 adalah simpulnya . Sebuah sederhana, istilah spline linear akan dihitung seperti ini: X s p l i n e = { 0X X
dan akan ditambahkan ke model Anda, selain istilah asli . Model pas akan menunjukkan penembusan tajam pada .7 dengan garis lurus dari 0 hingga .7, dan garis berlanjut dengan kemiringan berbeda dari .7 ke 1. Namun, suku spline tidak perlu linier. Secara khusus, telah ditentukan bahwa splines kubik sangat berguna (yaitu, X 3 s p l i n e
Pengantar paling sederhana untuk topik-topik ini yang saya tahu adalah:
sumber
Catatan online Cosma Shalizi pada kuliahnya Analisis Data Lanjutan dari Sudut Pandang Dasar cukup baik dalam hal ini, melihat hal-hal dari perspektif di mana interpolasi dan regresi adalah dua pendekatan untuk masalah yang sama. Saya secara khusus menarik perhatian Anda pada bab-bab tentang metode smoothing dan splines .
sumber