Saya mencari referensi ke makalah di mana validasi silang k-fold diperkenalkan (bukan hanya referensi akademis yang baik untuk subjek). Mungkin terlalu jauh ke belakang dalam kabut waktu untuk secara gamblang mengidentifikasi kertas pertama, sehingga setiap makalah awal di mana ide itu digunakan akan menarik.
Yang paling awal saya sadari adalah
PA Lachenbruch dan MR Mickey, "Estimasi tingkat kesalahan dalam analisis diskriminan," Technometrics, vol. 10, tidak. 1, hlm. 1–12 Februari 1968.
dan
A. Luntz dan V. Brailovsky, "Pada estimasi karakter yang diperoleh dalam prosedur statistik pengakuan (dalam bahasa Rusia)," Techicheskaya Kibernetica, vol. 3, 1969.
tetapi sejauh yang saya tahu mereka hanya mencakup validasi silang tinggalkan-satu-keluar (bahasa Rusia teknis saya tidak semuanya; o).
sumber
Jawaban:
Satu makalah yang mungkin layak dikonsultasikan adalah
Stone M. Cross-validatory choice dan penilaian prediksi statistik. J. Royal Stat. Soc., 36 (2), 111–147, 1974.
Saya telah melihat referensi
Analisis Mosteller F. dan Tukey JW , termasuk statistik. Dalam Buku Pegangan Psikologi Sosial. Addison-Wesley, Reading, MA, 1968.
Kertas 1931
Larson S. Penyusutan koefisien korelasi berganda. J. Educat. Psychol., 22: 45–55,1931.
disebutkan, misalnya oleh Stone, sebagai contoh awal di mana set validasi yang dipilih secara acak disisihkan untuk penilaian model selanjutnya.
sumber