Saya ingin memperkirakan interval kepercayaan untuk deviasi standar untuk beberapa data. Kode R terlihat seperti berikut:
library(boot)
sd_boot <- function (x, ind) {
res <- sd(x$ReadyChange[ind], na.rm = TRUE)
return(res)
}
data_boot <- boot::boot(data, statistic = sd_boot, R = 10000)
plot(data_boot)
Dan saya punya plot selanjutnya:
Saya terjebak dengan menafsirkan histogram bootstraps ini dengan benar. Setiap set data serupa lainnya menunjukkan distribusi normal perkiraan bootstrap ... Tapi tidak ini. Omong-omong, ini adalah data mentah aktual:
> data$ReadyChange
[1] 27.800000 8.985046 11.728021 8.830856 5.738600 12.028310 7.771528 9.208924 11.778611 6.024259 5.969931 6.063484 4.915764
[14] 12.027639 9.111146 13.898171 12.921377 6.916667 10.764479 6.875000 12.875000 7.017917 9.750000 7.921782 12.911551 6.000000
Bisakah Anda membantu saya dengan interpretasi dari pola bootstrap ini?
r
confidence-interval
standard-deviation
bootstrap
pengguna16
sumber
sumber
Jawaban:
Anda mungkin memiliki bug dalam kode Anda, atau perpustakaan bootstrap melakukan sesuatu yang lain dari yang diharapkan.Edit:
Setelah data dikoreksi disediakan, menjadi jelas bahwa pola disebabkan oleh satu pencilan, dengan masing-masing puncak sesuai dengan jumlah kali pencilan yang dipilih menjadi sampel.
sumber
inds <- matrix(sample(21,10000*21,replace=TRUE),10000,21)
dan kemudian mencari elemen data dari setiap kolom dan menemukan standar deviasi denganhist(apply(inds,1,function(ind){sd(data[ind])}))
. Tidak ada banyak puncak.Saya ragu-ragu untuk meletakkan ini sebagai jawaban, tetapi bagi saya ini tampaknya disebabkan oleh sejumlah kecil data yang Anda gunakan untuk bootstrap Anda (21, perbaiki saya jika saya salah).
Untuk lebih tepatnya, bagi saya tampaknya nilai-nilai spesifik ini , dari mana Anda sampel, hanya memiliki beberapa standar deviasi (puncak pada histogram Anda). Jika sampel dasar lebih besar dan lebih beragam, histogram yang dihasilkan akan jauh lebih halus (dan mungkin lebih mirip dengan distribusi normal yang Anda harapkan).
Pada catatan umum dan anggap saya di sini, ini adalah contoh yang baik untuk menunjukkan bootstrap tidak memecahkan masalah memiliki sampel kecil.
sumber