Pertanyaan yang diberi tag resampling

Resampling mengambil sampel dari sampel. Penggunaan umum adalah jackknifing (mengambil subsampel, misalnya semua nilai kecuali 1) & bootstrap (pengambilan sampel dengan penggantian). Teknik-teknik ini dapat memberikan perkiraan yang kuat dari distribusi sampling ketika akan sulit atau tidak mungkin untuk diturunkan secara analitis.

22
apa asumsi uji permutasi?

Sering dinyatakan bahwa tes permutasi tidak memiliki asumsi, namun ini tentu saja tidak benar. Sebagai contoh jika sampel saya entah bagaimana berkorelasi, saya dapat membayangkan bahwa mengubah label mereka tidak akan menjadi hal yang benar untuk dilakukan. Satu-satunya yang saya temukan tentang...

20
Metode pengambilan sampel caret

Saya menggunakan perpustakaan caretdi R untuk menguji berbagai prosedur pemodelan. The trainControlobjek memungkinkan seseorang untuk menentukan metode re-sampel. Metode dijelaskan dalam dokumentasi bagian 2.3 dan meliputi: boot, boot632, cv, LOOCV, LGOCV, repeatedcvdan oob. Meskipun beberapa di...

12
Bagaimana cara melakukan imputasi nilai dalam jumlah poin data yang sangat besar?

Saya memiliki dataset yang sangat besar dan sekitar 5% nilai acak hilang. Variabel-variabel ini berkorelasi satu sama lain. Contoh berikut dataset R hanyalah contoh mainan dengan data berkorelasi dummy. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE),...

11
Koefisien dan batas kesalahan gini

Saya memiliki serangkaian waktu data dengan N = 14 jumlah pada setiap titik waktu, dan saya ingin menghitung koefisien Gini dan kesalahan standar untuk perkiraan ini pada setiap titik waktu. Karena saya hanya memiliki N = 14 hitungan pada setiap titik waktu saya melanjutkan dengan menghitung...

11
Apakah bootstrap cocok untuk data kontinu ini?

Saya seorang pemula lengkap :) Saya sedang melakukan penelitian dengan ukuran sampel 10.000 dari populasi sekitar 745.000. Setiap sampel mewakili "persentase kesamaan". Sebagian besar sampel adalah sekitar 97% -98% tetapi beberapa berada di antara 60% dan 90%, yaitu, distribusi sangat condong...