Pertanyaan yang diberi tag resampling

9
Berlebihan dengan variabel kategori

Saya ingin melakukan kombinasi oversampling dan undersampling untuk menyeimbangkan dataset saya dengan sekitar 4000 pelanggan dibagi menjadi dua kelompok, di mana salah satu grup memiliki proporsi sekitar 15%. Saya telah melihat SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) dan...

9
Ukuran sampel bootstrap

Saya belajar tentang bootstrap sebagai cara memperkirakan varians statistik sampel. Saya punya satu keraguan mendasar. Mengutip dari http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Berapa banyak pengamatan yang harus kita sampel ulang? Saran yang baik adalah ukuran...

9
Model pembelajaran dalam mana yang dapat mengklasifikasikan kategori yang tidak eksklusif satu sama lain

Contoh: Saya memiliki kalimat dalam deskripsi pekerjaan: "Java senior engineer in UK". Saya ingin menggunakan model pembelajaran yang mendalam untuk memperkirakannya sebagai 2 kategori: English dan IT jobs. Jika saya menggunakan model klasifikasi tradisional, hanya dapat memprediksi 1 label dengan...

8
Subsampel sampel acak: sampel acak?

Katakanlah Anda memiliki sampel acak besar pemain sepak bola di Eropa tetapi Anda hanya tertarik pada apa yang terjadi di Spanyol. Bisakah Anda mengurangi sampel Anda menjadi pemain di Spanyol dan masih menyebutnya sampel acak (tetapi dari populasi yang berbeda)? Jika tidak, bagaimana Anda menyebut...