Splines dalam GLM dan GAM

12

Apakah salah bahwa splines hanya tersedia dalam model GAM, dan tidak dalam model GLM? Saya mendengar ini beberapa waktu lalu, dan bertanya-tanya apakah ini hanya kesalahpahaman, atau ada kebenarannya. Berikut ini ilustrasi: http://www.stats.uwo.ca/faculty/bellhouse/glm%20and%20gam.pdf

HeyJane
sumber

Jawaban:

18

E[Y|X]=β0+β1X+β2X2X

Spline dapat dengan mudah dilihat sebagai parametriisasi canggih dari satu atau lebih kovariat yang bernilai terus menerus semu.

AdamO
sumber
Terima kasih telah menjawab! Jadi dengan mengatakan bahwa saya salah, maksud Anda splines dapat digunakan dalam GLM, benar? Tidak sepenuhnya mengerti.
HeyJane
Ya, tentu saja. Di R, mengimpor paket splines, dan menjalankan bs(...)memungkinkan Anda untuk membuat representasi linier dari spline dengan derajat polinomial dan titik simpul yang ditentukan pengguna.
AdamO
7
Saya menulis banyak tentang pertanyaan ini di sini: madrury.github.io/jekyll/update/statistics/2017/08/04/…
Matthew Drury
Terima kasih banyak untuk kalian berdua! Saya melihatnya sekarang, AdamO! Halaman yang bagus, Matthew, aku akan membaca semuanya! :)
HeyJane
12

@ AdamO's jawaban benar, dalam cocok berbasis spline tentu dapat dilakukan dalam kerangka kerja GLM standar. Itu bukan untuk mengatakan bahwa GAM hanya kasus khusus dari GLM! Meskipun ada serangkaian model yang persis sama dan dapat dibingkai baik sebagai GAM atau sebagai GLM dengan perluasan kovariat secara spline, ada beberapa model GAM yang tidak tersedia dalam kerangka kerja GLM standar.

Misalnya, seseorang dapat memuat model GAM menggunakan spline smoothing untuk masing-masing kovariat. Ini pada dasarnya menghasilkan ekspansi spline dari variabel, tetapi dengan penalti pada derivatif kedua. Ini menghasilkan model yang sedikit di luar kerangka kerja GLM standar.

Selain itu, sering dianggap sebagai prosedur standar, dan dibangun di sebagian besar perpustakaan GAM, agar sesuai dengan parameter smoothing (yaitu derajat kebebasan spline, dll.) Dengan mengoptimalkan berbagai ukuran kesalahan sampel, sedangkan formulasi GLM biasanya mempertimbangkan ruang kovariat tetap.

Cliff AB
sumber
Saya berharap saya bisa membuat Anda marah, tetapi saya tidak punya cukup poin. Terima kasih telah berkontribusi. Saya tidak yakin saya mengerti paragraf kedua Anda: Anda mengatakan bahwa smoothing splines hanya cocok dengan GAM? Bisakah Anda menguraikan apa sebenarnya perbedaan antara spline kubik biasa dan spline kubik smoothing? Saya mengerti ini banyak bertanya.
HeyJane
@HeyJane: jika Anda melihat halaman wikipedia, Anda akan perhatikan bahwa splines ini dihukum oleh turunan keduanya. Hal ini memungkinkan seseorang untuk mengontrol kelancaran dengan penalti terus menerus daripada derajat kebebasan bilangan bulat. Dengan demikian, ini adalah masalah kemungkinan maksimum yang dihukum, bukan masalah kemungkinan maksimum standar. Ini berarti Anda tidak dapat mencocokkannya langsung dengan glmfungsi R , tidak seperti saat menggunakan splines kubik standar dengan glm.
Cliff AB
2
Aha! Saya mengerti! Jadi alih-alih, dengan spline kubik reguler, mengatakan bahwa kami hanya ingin turunan kedua sama pada simpulnya, kami ingin memaksakan beberapa properti pada turunan kedua, yaitu turunan kedua tidak menjadi terlalu tinggi, maka dalam jangka waktu penalti?
HeyJane
@ HeiJane: ya, saya akan mengatakan itu ringkasan yang bagus.
Cliff AB