Penalaran dan pengkondisian yang sering pada pengamatan (contoh dari Wagenmakers et al.)

9

Saya bukan ahli dalam statistik, tetapi saya menemukan ada ketidaksepakatan apakah interpretasi probabilitas "frequentist" atau "Bayesian" adalah yang "benar". Dari Wagenmakers et. al p. 183:

Pertimbangkan distribusi seragam dengan rata-rata dan lebar . Menggambar dua nilai secara acak dari distribusi ini, label yang terkecil dan yang terbesar , dan memeriksa apakah mean terletak di antara dan . Jika prosedur ini diulang berkali-kali, mean akan berada di antara dan dalam setengah dari kasus. Dengan demikian, memberikan interval kepercayaan 50% lebih sering untuk . Tapi anggaplah untuk undian tertentu, dan1 s l μ s l μ s l ( s , l ) μ s = 9.8 l = 10.7 0.9 s l s < μ < lμ1slμslμsl(s,l)μs=9.8l=10.7. Perbedaan antara nilai-nilai ini adalah , dan ini mencakup 9/10 dari rentang distribusi. Oleh karena itu, untuk nilai-nilai dan kita dapat 100% yakin bahwa , meskipun interval kepercayaan yang sering terjadi akan membuat Anda yakin Anda hanya boleh percaya diri 50%.0.9sls<μ<l

Apakah benar-benar ada orang yang percaya bahwa hanya ada kepercayaan diri 50% dalam kasus ini atau apakah itu orang bodoh?

Saya kira secara lebih umum, buku ini sepertinya mengatakan bahwa frequentist tidak dapat mengekspresikan klaim bersyarat seperti "Diberikan dan , dengan probabilitas 1". Benarkah pengkondisian menyiratkan penalaran Bayesian?l = 10,7 s < μ < ls=9.8l=10.7s<μ<l

Xodarap
sumber
8
Ketiga jawaban saat ini sangat bagus. Saya akan menambahkan hanya bahwa pembuat Wagen membuat argumen stroberi dalam arti bahwa tidak ada ahli statistik sering akan merekomendasikan interval kepercayaan ini - itu ada dalam literatur hanya sebagai contoh dari interval kepercayaan patologis. Dari sudut pandang yang sering, ini menunjukkan bahwa cakupan kepercayaan saja tidak cukup untuk kesimpulan yang baik. (Saya seorang Bayesian.)
Cyan

Jawaban:

14

Ada beberapa kecurangan rumit yang terlibat. Interval kepercayaan tidak menggunakan informasi bahwa kisaran seragam adalah 1, dan dengan demikian non-parametrik, sedangkan klaim yang dibuat tentang sampel dengan lakukan, dan sangat tergantung pada model. Saya cukup yakin seseorang dapat meningkatkan cakupan atau lamanya interval kepercayaan (diharapkan) jika informasi ini diperhitungkan. Untuk satu hal, titik akhir distribusi paling banyak jauh dari atau . Oleh karena itu, interval kepercayaan 100% untuk adalah .l - s = 0,9 1 - ( l(s,l)ls=0.9s l μ ( l - 1 / 2 , s + 1 / 2 )1(ls)slμ(l1/2,s+1/2)

Masalah khusus ini masuk dalam domain inferensi untuk distribusi teridentifikasi sebagian dipelajari dalam 10-15 tahun terakhir secara ekstensif dalam ekonometrik teoritis. Kemungkinan, dan karenanya Bayesian, kesimpulan untuk distribusi seragam jelek, karena merupakan masalah yang tidak teratur (dukungan distribusi tergantung pada parameter yang tidak diketahui).

Tugas
sumber
Saya ragu Anda dapat menurunkan panjang yang diharapkan di bawah untuk interval kepercayaan 50% pada sampel 2 item. 13
Henry
11

Saya ragu untuk menjawab ini. Pertengkaran Frequentist vs Bayesian ini umumnya tidak produktif, dan dapat menjadi jahat dan remaja. Untuk apa nilainya, Wagenmakers adalah jenis masalah besar, sedangkan sebagian besar filsuf Cina 3k + tahun dilupakan di sisi lain ...

Namun, saya berpendapat bahwa interpretasi Frequentist standar dari interval kepercayaan 50% bukanlah bahwa Anda harus yakin 50% nilai sebenarnya terletak di dalam interval, atau bahwa ada kemungkinan 50% bahwa itu terjadi. Sebaliknya, idenya sederhana adalah bahwa, jika proses yang sama diulang tanpa batas waktu, persentase CI yang termasuk nilai sebenarnya akan konvergen menjadi 50%. Namun, untuk setiap interval tunggal yang diberikan, probabilitas bahwa ia menyertakan nilai sebenarnya adalah 0 atau 1, tetapi Anda tidak tahu yang mana .

gung - Pasang kembali Monica
sumber
5

Saya pikir ini adalah argumen yang lemah untuk kasus yang kuat.

( 3 l + s - 1(s,l) mungkin interval kepercayaan 50% dalam arti yang ditentukan, tetapi demikian juga , dan saya pikir yang terakhir dapat dibenarkan sebagai yang lebih baik dalam keadaan ini, karena meluas tanpa penyesuaian lebih lanjut ke ukuran sampel yang lebih besar; perhatikan juga bahwa interval kepercayaan terakhir tidak pernah lebih luas dari dan lebar yang diharapkan untuk sampel ukuran adalah .1(3l+s14,3s+l+14) n112n1n+1

Henry
sumber
Dalam contoh sampel yang dikutip , alternatif yang saya sarankan akan memberikan interval kepercayaan , yang jelas merupakan bagian tengah dari interval kepercayaan logis 50 % [ 10.225 , 10.275 ] 100 % [ 10.2 , 10.3 ]{9.8,10.7}50%[10.225,10.275]100%[10.2,10.3]
Henry