Jackknife vs LOOCV

15

Apakah benar-benar ada perbedaan antara jackknife dan meninggalkan satu validasi silang? Prosedurnya terlihat sama, apakah saya melewatkan sesuatu?

Musim dingin
sumber

Jawaban:

11

Dalam validasi silang, Anda menghitung statistik pada sampel yang ditinggalkan. Paling sering, Anda memprediksi sampel yang ditinggalkan oleh model yang dibangun di atas sampel yang disimpan. Dalam jackknifing, Anda menghitung statistik hanya dari sampel yang disimpan.

Tommy L
sumber
4
Saya tidak mengerti bagaimana jawaban ini berbicara kepada LOOCV dalam pertanyaan awal. Dalam arti apa seseorang dapat "menghitung statistik" pada satu pengamatan yang ditinggalkan?
Alexis
12

Jackknife sering merujuk pada 2 proses terkait tetapi berbeda, yang keduanya mengandalkan pendekatan cuti-keluar - yang mengarah pada kebingungan ini.

Dalam satu konteks, jackknife dapat digunakan untuk memperkirakan parameter populasi dan kesalahan standarnya. Sebagai contoh, untuk menggunakan pendekatan pisau lipat untuk memperkirakan kemiringan dan mencegat model regresi sederhana, orang akan:

  1. Perkirakan kemiringan dan intersep menggunakan semua data yang tersedia.
  2. Tinggalkan 1 pengamatan dan perkirakan kemiringan dan intersep (juga dikenal sebagai "estimasi parsial" dari koefisien).
  3. Hitung perbedaan antara "estimasi parsial" dan "semua data" estimasi kemiringan dan intersep (juga dikenal sebagai "nilai semu" dari koefisien).
  4. Ulangi langkah 2 & 3 untuk seluruh kumpulan data.
  5. Hitung nilai rata-rata semu untuk masing-masing koefisien - ini adalah taksiran jackknife dari kemiringan dan intersep

Nilai pseudo dan estimasi jackknife dari koefisien juga dapat digunakan untuk menentukan kesalahan standar dan interval kepercayaan. Biasanya pendekatan ini memberikan interval kepercayaan yang lebih luas untuk koefisien karena merupakan ukuran ketidakpastian yang lebih baik, lebih konservatif. Juga, pendekatan ini dapat digunakan untuk mendapatkan estimasi bias pada pisau lipat untuk koefisien juga.

Dalam konteks lain, jackknife digunakan untuk mengevaluasi kinerja model. Dalam hal ini jackknife = validasi silang leave-one-out. Keduanya merujuk pada meninggalkan satu pengamatan dari set data kalibrasi, mengkalibrasi ulang model, dan memprediksi pengamatan yang ditinggalkan. Pada dasarnya, setiap pengamatan diprediksi menggunakan "perkiraan parsial" dari para prediktor.

Inilah sedikit artikel bagus tentang jackknife yang saya temukan online: https://www.utdallas.edu/~herve/abdi-Jackknife2010-pretty.pdf

jcmb
sumber
1
Kecuali saya salah (dan saya mungkin juga), konteks pertama Anda menjelaskan validasi silang sisakan-keluar .
Alexis
2
Saya baru saja memisahkan ide estimasi parameter menggunakan LOO versus memperkirakan nilai yang ditinggalkan (seperti pada LOOCV). Saya melihat mereka sebagai dua proses terkait tetapi sedikit berbeda, tetapi mungkin keduanya dapat disebut sebagai LOOCV? Saya juga bisa salah.
jcmb