Apa arti dari interval kepercayaan yang diambil dari contoh-contoh bootstrap?

38

Saya telah melihat banyak pertanyaan di situs ini mengenai interval bootstrap dan kepercayaan diri, tetapi saya masih bingung. Sebagian alasan kebingungan saya mungkin karena saya tidak cukup maju dalam pengetahuan statistik saya untuk memahami banyak jawaban. Saya hampir setengah jalan melalui kursus statistik pengantar dan tingkat matematika saya hanya tentang pertengahan-Aljabar II, jadi apa pun yang melewati tingkat itu hanya membingungkan saya. Jika salah satu orang berpengetahuan di situs ini dapat menjelaskan masalah ini di tingkat saya, itu akan sangat membantu.

Kami belajar di kelas bagaimana mengambil sampel menggunakan metode bootstrap dan menggunakannya untuk membangun interval kepercayaan untuk beberapa statistik yang ingin kami ukur. Jadi misalnya, katakan kita mengambil sampel dari populasi besar dan menemukan bahwa 40% mengatakan mereka akan memilih Calon A. Kami berasumsi bahwa sampel ini adalah refleksi yang cukup akurat dari populasi asli, dalam hal ini kita dapat mengambil sampel dari untuk menemukan sesuatu tentang populasi. Jadi kami mengambil sampel dan menemukan (menggunakan tingkat kepercayaan 95%) bahwa interval kepercayaan yang dihasilkan berkisar antara 35% hingga 45%.

Pertanyaan saya adalah, apa sebenarnya arti dari interval kepercayaan ini ?

Saya terus membaca bahwa ada perbedaan antara Interval Kepercayaan (Frequentist) dan Interval Kredibel (Bayesian). Jika saya mengerti dengan benar, interval yang kredibel akan mengatakan bahwa ada kemungkinan 95% bahwa dalam situasi kita parameter sebenarnya berada dalam interval yang diberikan (35% -45%), sementara interval kepercayaan akan mengatakan bahwa ada 95% dalam hal ini. jenis situasi (tetapi tidak harus dalam situasi kami secara khusus) metode yang kami gunakan akan melaporkan secara akurat bahwa parameter sebenarnya berada dalam interval yang diberikan.

Dengan asumsi definisi ini benar, pertanyaan saya adalah: Apa "parameter sebenarnya" yang kita bicarakan ketika menggunakan interval kepercayaan yang dibangun menggunakan metode bootstrap? Apakah kita mengacu pada (a) parameter sebenarnya dari populasi asli , atau (b) parameter sebenarnya dari sampel ? Jika (a), maka kita akan mengatakan bahwa 95% dari waktu metode bootstrap akan secara akurat melaporkan pernyataan yang benar tentang populasi asli. Tapi bagaimana kita bisa tahu itu? Tidak seluruh metode bootstrap bersandar pada asumsibahwa sampel asli merupakan cerminan akurat dari populasi yang diambilnya? Jika (b) maka saya tidak mengerti arti dari interval kepercayaan sama sekali. Bukankah kita sudah tahu parameter sebenarnya dari sampel? Ini pengukuran langsung!

Saya membahas hal ini dengan guru saya dan dia sangat membantu. Tapi saya masih bingung.

iwwain
sumber

Jawaban:

28

Jika prosedur bootstrap dan pembentukan interval kepercayaan dilakukan dengan benar, itu berarti sama dengan interval kepercayaan lainnya. Dari perspektif frequentist, CI 95% menyiratkan bahwa jika seluruh penelitian diulang secara identik ad infinitum , 95% dari interval kepercayaan yang dibentuk dengan cara ini akan mencakup nilai sebenarnya. Tentu saja, dalam penelitian Anda, atau dalam studi individual apa pun, interval kepercayaan akan mencakup nilai sebenarnya atau tidak, tetapi Anda tidak akan tahu yang mana. Untuk memahami ide-ide ini lebih lanjut, ada baiknya Anda membaca jawaban saya di sini: Mengapa 95% Confidence Interval (CI) tidak menyiratkan peluang 95% mengandung mean?

Mengenai pertanyaan Anda selanjutnya, 'nilai sebenarnya' mengacu pada parameter aktual dari populasi yang relevan. (Sampel tidak memiliki parameter, mereka memiliki statistik ; misalnya, mean sampel, , adalah statistik sampel, tetapi mean populasi, , adalah parameter populasi.) Mengenai cara kami mengetahuinya, dalam praktiknya kami tidak. Anda benar bahwa kami mengandalkan beberapa asumsi - kami selalu begitu. Jika asumsi-asumsi itu benar, dapat dibuktikan bahwa sifat-sifat itu berlaku. Ini adalah titik kerja Efron di akhir tahun 1970-an dan awal 1980-an, tetapi matematika sulit bagi kebanyakan orang untuk mengikuti. Untuk penjelasan yang agak matematis dari bootstrap, lihat jawaban @ StasK di sini: Menjelaskan kepada orang awam mengapa bootstrap berfungsix¯μ. Untuk demonstrasi singkat tentang matematika, pertimbangkan simulasi berikut menggunakan R:

# a function to perform bootstrapping
boot.mean.sampling.distribution = function(raw.data, B=1000){
  # this function will take 1,000 (by default) bootsamples calculate the mean of 
  # each one, store it, & return the bootstrapped sampling distribution of the mean

  boot.dist = vector(length=B)     # this will store the means
  N         = length(raw.data)     # this is the N from your data
  for(i in 1:B){
    boot.sample  = sample(x=raw.data, size=N, replace=TRUE)
    boot.dist[i] = mean(boot.sample)
  }
  boot.dist = sort(boot.dist)
  return(boot.dist)
}

# simulate bootstrapped CI from a population w/ true mean = 0 on each pass through
# the loop, we will get a sample of data from the population, get the bootstrapped 
# sampling distribution of the mean, & see if the population mean is included in the
# 95% confidence interval implied by that sampling distribution

set.seed(00)                       # this makes the simulation reproducible
includes = vector(length=1000)     # this will store our results
for(i in 1:1000){
  sim.data    = rnorm(100, mean=0, sd=1)
  boot.dist   = boot.mean.sampling.distribution(raw.data=sim.data)
  includes[i] = boot.dist[25]<0 & 0<boot.dist[976]
}
mean(includes)     # this tells us the % of CIs that included the true mean
[1] 0.952
gung - Reinstate Monica
sumber
Asumsi khusus mana yang kita andalkan?
iarwain
2
Terima kasih. Saya pikir saya menemukan apa yang saya cari di jawaban kedua untuk utas itu: "Ingat bahwa kami tidak menggunakan sarana sampel bootstrap untuk memperkirakan rata-rata populasi, kami menggunakan rata-rata sampel untuk itu (atau apa pun statistik minat) tetapi kita menggunakan sampel bootstrap untuk memperkirakan properti (penyebaran, bias) dari proses pengambilan sampel. Dan menggunakan sampel dari populasi yang tahu (yang kami harap mewakili populasi yang diminati) untuk mempelajari efek dari pengambilan sampel masuk akal dan jauh lebih melingkar. " ...
iarwain
1
... Dengan kata lain, semua CI memberi tahu kami adalah bahwa dalam suatu populasi yang kira-kira mirip dengan kita, kita akan mengharapkan 95% sampel yang diambil dari populasi itu mencerminkan nilai sebenarnya +/- margin of error. Jadi semua yang kami lakukan adalah memberikan petunjuk yang sangat kasar - meskipun mungkin petunjuk terbaik yang kami miliki - untuk mengetahui seberapa dekat statistik sampel kami dengan parameter populasi yang sebenarnya. Jika demikian, maka kedengarannya kita tidak seharusnya menganggap angka-angka yang tepat dalam CI terlalu serius - mereka hanya berarti, "statistik sampel mungkin kira-kira akurat untuk sekitar tingkat ini." Apakah saya benar?
iarwain
1
Itu pada dasarnya benar. A CI memberi kita perasaan tentang ketepatan estimasi kami, tetapi kami tidak pernah tahu apakah CI kami yang sebenarnya (terealisasi) memang mengandung nilai sebenarnya. Asumsi utama adalah bahwa data kami mewakili populasi yang diminati. Perhatikan bahwa tak satu pun dari ini khusus untuk CI bootstrap , Anda memiliki interpretasi & asumsi yang sama dalam CI yang dihitung melalui teori asimptotik.
gung - Reinstate Monica
1
Ini adalah penjelasan yang bagus. Saya hanya akan menambahkan bahwa "nilai sebenarnya" kadang-kadang merupakan artefak dari desain penelitian. Dalam pemungutan suara untuk kandidat politik, sampel bertingkat memberikan perkiraan yang jauh lebih tepat dan dapat diandalkan daripada sampel acak. Biaya tersebut merupakan risiko melampiaskan kelompok yang salah dengan desain. Dalam hal itu, CI 95% berpusat pada nilai yang benar, yang dicapai dengan mereplikasi studi ad infinitum , tetapi nilai itu bukan arti lain dari parameter sejati: parameter yang ingin kami perkirakan. Inilah mengapa desain dan inferensi studi terkait secara intrinsik.
AdamO
0

Apa yang Anda katakan adalah bahwa tidak perlu menemukan interval kepercayaan dari contoh bootstrapped. Jika Anda puas dengan statistik (rata-rata sampel atau proporsi sampel) yang diperoleh dari sampel yang di-bootstrap, tidak menemukan interval kepercayaan dan karenanya, tidak ada pertanyaan tentang interpretasi. Tetapi jika Anda tidak puas dengan statistik yang diperoleh dari contoh-contoh bootstrap atau puas tetapi masih ingin menemukan interval kepercayaan, maka interpretasi untuk interval kepercayaan tersebut sama dengan interval kepercayaan lainnya. Itu karena ketika sampel bootstrap Anda persis mewakili (atau diasumsikan demikian) populasi asli, lalu dimanakah kebutuhan interval kepercayaan? Statistik dari sampel bootstrap adalah parameter populasi asli itu sendiri, tetapi ketika Anda tidak menganggap statistik sebagai parameter populasi asli, maka ada kebutuhan untuk menemukan interval kepercayaan. Jadi, ini semua tentang bagaimana Anda mempertimbangkan. Katakanlah Anda menghitung interval kepercayaan 95% dari contoh bootstrap. Sekarang interpretasinya adalah: "95% dari waktu, metode bootstrap ini secara akurat menghasilkan interval kepercayaan yang mengandung parameter populasi yang benar".

(Ini yang saya pikirkan. Perbaiki saya jika ada kesalahan).

Chikatla Prashanth
sumber
-1

Kami merujuk pada parameter sebenarnya dari populasi asli. Dimungkinkan untuk melakukan ini dengan asumsi bahwa data diambil secara acak dari populasi asli - dalam kasus itu, ada argumen matematis yang menunjukkan bahwa prosedur bootstrap akan memberikan interval kepercayaan yang valid, setidaknya karena ukuran dataset menjadi cukup besar. .

Gareth
sumber
Jadi kedengarannya seperti untuk memahami mengapa itu berhasil, saya harus tahu cukup matematika untuk mengikuti bukti matematika. Apakah itu benar?
iarwain
Saya kira begitu (saya tidak terbiasa dengan buktinya)
Gareth
Namun secara intuitif, Anda dapat melihat bahwa ketika ukuran sampel bertambah besar, sampel mulai terlihat sangat mirip dengan populasi. Sebagai contoh, katakan saya mengambil 1 juta sampel dari distribusi normal dengan mean dan varian yang diberikan. Sebut sampel ini X. Sampel acak (dengan penggantian) yang diambil dari X sangat mirip dengan sampel acak yang diambil dari distribusi asli. Saya pikir ini adalah ide dasar mengapa ini bekerja.
Gareth