Saya sudah sering mendengar ungkapan ini, tetapi tidak pernah sepenuhnya mengerti apa artinya. Ungkapan "properti frequentist yang baik" memiliki ~ 2.750 hits di google saat ini, 536 di scholar.google.com, dan 4 di stats.stackexchange.com .
Hal terdekat yang saya temukan dengan definisi yang jelas berasal dari slide terakhir dalam presentasi Universitas Stanford ini , yang menyatakan
[T] maksudnya melaporkan interval kepercayaan 95% adalah Anda “menjebak” parameter sebenarnya dalam 95% klaim yang Anda buat, bahkan di seluruh masalah estimasi yang berbeda. Ini adalah karakteristik yang menentukan dari prosedur estimasi dengan sifat frequentist yang baik: mereka menyimpan sampai pengawasan ketika digunakan berulang kali.
Merefleksikan sedikit tentang ini, saya berasumsi bahwa frasa "sifat-sifat frequentist baik" menyiratkan beberapa penilaian metode Bayesian, dan khususnya metode Bayesian konstruksi interval. Saya mengerti bahwa interval Bayesian dimaksudkan untuk memuat nilai sebenarnya dari parameter dengan probabilitas . Interval frekuensi dimaksudkan untuk dibangun sedemikian rupa sehingga jika jika proses konstruksi interval diulang berkali-kali sekitar p ∗ 100 %interval akan berisi nilai sebenarnya dari parameter. Interval bayesian secara umum tidak membuat janji tentang berapa% interval akan mencakup nilai sebenarnya dari parameter. Namun, beberapa metode Bayesian juga memiliki properti yang jika diulang berkali-kali mereka menutupi nilai sebenarnya sekitar dari waktu. Ketika mereka memiliki properti itu, kami mengatakan mereka memiliki "properti frequentist yang baik".
Apakah itu benar? Saya pikir pasti ada yang lebih dari itu, karena frasa ini merujuk pada sifat frequentist yang baik , daripada memiliki properti frequentist yang bagus .
sumber
Jawaban:
Suatu hal yang rumit tentang properti frequentist yang baik adalah bahwa mereka adalah properti dari suatu prosedur daripada sifat dari hasil atau kesimpulan tertentu. Prosedur frequentist yang baik menghasilkan kesimpulan yang benar pada proporsi kasus yang ditentukan dalam jangka panjang, tetapi prosedur Bayesian yang baik seringkali merupakan prosedur yang menghasilkan kesimpulan yang benar dalam kasus individu yang bersangkutan.
Sebagai contoh, pertimbangkan prosedur Bayesian yang "baik" dalam pengertian umum karena prosedur ini memasok distribusi probabilitas posterior atau interval kredibel yang dengan benar mewakili kombinasi bukti (fungsi kemungkinan) dengan distribusi probabilitas sebelumnya. Jika prior berisi informasi yang akurat (katakanlah, daripada pendapat kosong atau semacam sebelum informasi), posterior atau interval yang mungkin menghasilkan inferensi yang lebih baik daripada hasil yang sering dari data yang sama. Lebih baik dalam arti mengarah pada kesimpulan yang lebih akurat tentang kasus khusus ini atau interval estimasi yang lebih sempit karena prosedur menggunakan disesuaikan sebelumnya yang berisi informasi yang akurat. Dalam jangka panjang persentase cakupan interval dan kebenaran kesimpulan dipengaruhi oleh kualitas masing-masing sebelumnya.
Perhatikan bahwa prosedur tidak menentukan bagaimana prior harus diperoleh dan akuntansi kinerja jangka panjang akan, mungkin, mengasumsikan any-old prior daripada yang dirancang khusus sebelum untuk setiap kasus.
Prosedur Bayesian dapat memiliki sifat sering yang baik. Sebagai contoh, dalam banyak kasus prosedur Bayesian dengan resep sebelumnya yang diberikan tanpa informasi akan memiliki sifat frequentist yang cukup baik hingga sangat baik. Sifat-sifat yang baik akan menjadi kecelakaan daripada fitur desain, dan akan menjadi konsekuensi langsung dari prosedur seperti itu menghasilkan interval yang sama dengan prosedur yang sering terjadi.
Dengan demikian prosedur Bayesian dapat memiliki sifat inferensial superior dalam percobaan individu sementara memiliki sifat frequentist yang buruk dalam jangka panjang. Secara ekivalen, prosedur frequentist dengan properti frequentist jangka panjang yang baik sering memiliki kinerja yang buruk dalam kasus percobaan individu.
sumber
Saya akan menjawab bahwa analisis Anda benar. Untuk memberikan beberapa wawasan lagi, saya akan menyebutkan prior yang cocok.
Prior yang cocok biasanya prior yang dirancang untuk membangun model Bayesian dengan properti yang sering. Secara khusus, mereka didefinisikan sehingga interval hpd yang diperoleh memenuhi cakupan interval kepercayaan yang sering (jadi 95% dari 95% hpd mengandung nilai sebenarnya dalam jangka panjang). Perhatikan bahwa, dalam 1d, ada solusi analitis: prior Jeffreys cocok dengan prior. Dalam dimensi yang lebih tinggi, ini tidak perlu terjadi (untuk pengetahuan saya, tidak ada hasil yang membuktikan bahwa ini tidak pernah terjadi).
Dalam praktiknya, prinsip pencocokan ini kadang-kadang juga diterapkan untuk menyelaraskan nilai beberapa parameter model: data kebenaran tanah digunakan untuk mengoptimalkan parameter ini dalam arti bahwa nilainya memaksimalkan cakupan frekuensi interval yang kredibel untuk parameter bunga yang dihasilkan. . Dari eksperimen saya sendiri, ini mungkin tugas yang sangat halus.
sumber
Sekarang, untuk menjawab pertanyaan Anda: tidak, itu tidak menyiratkan penilaian metode Bayesian. Melewatkan nuansa dan fokus pada prosedur estimasi agar tetap sederhana: frekuensi dalam statistik adalah bahwa gagasan memperkirakan kuantitas tetap yang tidak diketahui, atau menguji hipotesis, dan mengevaluasi prosedur tersebut terhadap pengulangan hipotetis itu. Anda dapat mengadopsi banyak kriteria untuk mengevaluasi suatu prosedur. Apa yang membuatnya menjadi kriteria yang sering adalah bahwa seseorang peduli dengan apa yang terjadi jika seseorang mengadopsi prosedur yang sama berulang kali. Jika Anda melakukannya, Anda peduli dengan properti yang sering muncul. Dengan kata lain: "apa saja properti yang sering muncul?" berarti "apa yang terjadi jika kita mengulangi prosedur berulang kali?" Sekarang, apa yang membuat properti frequentist seperti itu bagusadalah lapisan kriteria lainnya. Properti frequentist yang paling umum yang dianggap sebagai properti baik adalah konsistensi (dalam estimasi, jika Anda terus mengambil sampel, estimator akan menyatu dengan nilai tetap yang Anda perkirakan), efisiensi (jika Anda terus mengambil sampel, varians dari estimator akan menjadi nol , sehingga Anda akan lebih dan lebih akurat), kemungkinan cakupan(dalam banyak pengulangan prosedur, interval kepercayaan 95% akan mengandung nilai sebenarnya 95% dari waktu). Dua yang pertama disebut properti sampel besar, yang ketiga adalah properti Neyman-benar-benar sering dalam arti bahwa itu tidak perlu menggunakan hasil asimptotik. Jadi, singkatnya, dalam kerangka kerja yang sering terjadi, ada nilai yang benar dan tidak diketahui. Anda memperkirakannya dan Anda selalu (kecuali dalam kecelakaan keberuntungan langka) salah dalam estimasi, tetapi Anda mencoba menyelamatkan diri dengan mengharuskan bahwa setidaknya di bawah pengulangan tak terduga estimasi Anda secara hipotetis, Anda akan semakin salah atau kurangAnda tahu Anda akan benar beberapa kali. Saya tidak akan membahas apakah itu masuk akal atau tidak, atau asumsi tambahan yang diperlukan untuk membenarkannya, mengingat itu bukan pertanyaan Anda. Secara konseptual, itulah yang dimaksud oleh properti frequentist , dan yang baik berarti secara umum dalam konteks seperti itu.
Saya akan menutup dengan menunjukkan makalah ini kepada Anda, sehingga Anda menilai sendiri apakah masuk akal dan apa artinya prosedur Bayesian untuk memiliki properti frequentist yang baik (Anda akan menemukan lebih banyak referensi di sana):
sumber