Pertanyaan yang diberi tag out-of-sample

Mengacu pada praktik menilai performa model pada beberapa kumpulan data "pengujian" atau "pisahan" atau "di luar sampel" yang tidak digunakan untuk pembuatan model.

11
Apa cara yang lebih tepat untuk membuat set penahan: untuk menghapus beberapa mata pelajaran atau untuk menghapus beberapa pengamatan dari setiap mata pelajaran?

Saya memiliki dataset dengan 26 fitur dan 31000 baris. Ini adalah dataset dari 38 subjek. Ini untuk sistem biometrik. Jadi saya ingin dapat mengidentifikasi mata pelajaran. Untuk memiliki set pengujian, saya tahu saya harus menghapus beberapa nilai. Jadi apa yang lebih baik untuk dilakukan dan...