Saya sering mendengar klaim bahwa statistik Bayesian bisa sangat subjektif. Argumen utama adalah bahwa inferensi tergantung pada pilihan prior (walaupun seseorang dapat menggunakan prinsip indiferensi o entropi maksimum untuk memilih prior). Sebagai perbandingan, klaim berjalan, statistik frequentist secara umum lebih objektif. Berapa banyak kebenaran dalam pernyataan ini?
Juga, ini membuat saya bertanya-tanya:
- Apa elemen konkret dari statistik frequentist (jika ada) yang bisa sangat subjektif dan yang tidak ada atau kurang penting dalam statistik Bayesian?
- Apakah subjektivitas lebih umum di Bayesian daripada dalam statistik frequentist?
bayesian
interpretation
frequentist
philosophical
Amelio Vazquez-Reina
sumber
sumber
Jawaban:
Aku juga. Tapi perhatikan bahwa ada ambiguitas utama dalam menyebut sesuatu subjektif.
Subjektivitas (kedua indera)
Subyektif dapat berarti (setidaknya) salah satu dari
Bayesianisme adalah subyektif dalam arti kedua karena selalu menawarkan cara untuk memperbarui kepercayaan yang diwakili oleh distribusi probabilitas dengan mengkondisikan informasi. (Catatan bahwa apakah mereka keyakinan adalah keyakinan bahwa beberapa subjek sebenarnya memiliki atau hanya keyakinan bahwa subjek bisa miliki adalah tidak relevan untuk memutuskan apakah itu adalah 'subjektif'.)
Sebenarnya, jika prior mewakili kepercayaan pribadi Anda tentang sesuatu, maka Anda hampir pasti tidak memilihnya sama seperti Anda memilih sebagian besar keyakinan Anda. Dan jika itu mewakili kepercayaan seseorang maka itu bisa menjadi representasi yang kurang lebih akurat dari kepercayaan itu, jadi ironisnya akan ada fakta 'obyektif' tentang seberapa baik itu mewakili mereka.
Orang bisa, meskipun ini tidak cenderung menggeneralisasi dengan sangat lancar ke domain kontinu. Juga, bisa dibilang tidak mungkin menjadi datar atau 'acuh tak acuh' di semua parameterisasi sekaligus (walaupun saya tidak pernah yakin mengapa Anda ingin menjadi).
Jadi bagaimana kita mengevaluasi klaim ini?
Saya menyarankan bahwa dalam pengertian kedua subyektif: sebagian besar benar. Dan dalam arti subyektif pertama: itu mungkin salah.
Frekuensi sebagai subyektif (pengertian kedua)
Beberapa detail historis bermanfaat untuk memetakan masalah
Untuk Neyman dan Pearson hanya ada perilaku induktif bukan inferensi induktif dan semua evaluasi statistik bekerja dengan sifat sampling jangka panjang dari penduga. (Karenanya analisis alpha dan kekuatan, tetapi tidak nilai p). Itu cukup tidak subyektif dalam kedua pengertian.
Memang itu mungkin, dan saya pikir cukup masuk akal, untuk berdebat di bawah ini bahwa Frequentism sebenarnya bukan kerangka inferensi sama sekali, melainkan kumpulan kriteria evaluasi untuk semua prosedur inferensi yang mungkin yang menekankan perilaku mereka dalam aplikasi berulang. Contoh-contoh sederhana adalah konsistensi, ketidakberpihakan, dll. Ini membuatnya jelas tidak subyektif dalam pengertian 2. Namun, juga berisiko menjadi subyektif dalam arti 1 ketika kita harus memutuskan apa yang harus dilakukan ketika krteria itu tidak berlaku (misalnya ketika tidak ada penaksir yang tidak bias untuk dimiliki) atau ketika mereka berlaku tetapi bertentangan.
Fisher menawarkan Frequentism yang kurang subyektif yang menarik. Untuk Fisher, ada yang namanya inferensi induktif, dalam arti bahwa subjek, ilmuwan, membuat kesimpulan berdasarkan analisis data, yang dilakukan oleh ahli statistik. (Karenanya nilai-p tetapi bukan analisis alfa dan daya). Namun, keputusan tentang bagaimana berperilaku, apakah akan melanjutkan penelitian dll dibuat oleh ilmuwan berdasarkan pemahamannya tentang teori domain, bukan oleh ahli statistik yang menerapkan paradigma inferensi. Karena pembagian kerja nelayan ini, baik subjektivitas (indera 2) dan subjek individu (indera 1) duduk di sisi sains, bukan sisi statistik.
Berbicara secara hukum, Frequentism Fisher adalah subyektif. Hanya saja subjek yang subjektif bukan ahli statistik.
Ada berbagai sintesis yang tersedia, baik campuran yang nyaris tidak koheren dari keduanya yang Anda temukan dalam buku teks statistik terapan dan versi yang lebih bernuansa, misalnya 'Statistik Kesalahan' yang didorong oleh Deborah Mayo. Yang terakhir ini cukup tidak subyektif dalam pengertian 2, tetapi sangat subyektif dalam arti 1, karena peneliti harus menggunakan penilaian ilmiah - gaya Fisher - untuk mencari tahu apa probabilitas kesalahan itu penting dan harus diuji.
Frequentism sebagai subyektif (first sense)
Jadi apakah Frequentism kurang subyektif dalam arti pertama? Tergantung. Setiap prosedur inferensi dapat diliputi dengan kekhasan sebagai benar-benar diterapkan. Jadi mungkin lebih berguna untuk bertanya apakah Frequentism mendorong pendekatan yang kurang subyektif (pertama)? Saya ragu - saya pikir penerapan metode subyektif (indra kedua) secara sadar mengarah pada hasil yang kurang subyektif (indra pertama), tetapi bisa dibantah.
Asumsikan sejenak bahwa subjektivitas (pengertian pertama) menyelinap ke dalam analisis melalui 'pilihan'. Bayesianisme tampaknya melibatkan lebih banyak 'pilihan'. Dalam kasus yang paling sederhana, pilihan dihitung sebagai: satu set asumsi yang berpotensi istimewa untuk Frequentist (fungsi Likelihood atau yang setara) dan dua set untuk Bayesian (Kemungkinan dan sebelumnya dari yang tidak diketahui).
Namun, orang Bayesian tahu bahwa mereka bersikap subyektif (dalam arti kedua) tentang semua pilihan ini sehingga mereka cenderung lebih sadar diri tentang implikasi yang seharusnya mengarah pada kurang subjektivitas (dalam arti pertama).
Sebaliknya, jika seseorang melihat sebuah tes dalam buku besar tes, maka orang bisa mendapatkan perasaan bahwa hasilnya kurang subyektif (indra pertama), tetapi bisa dibilang itu adalah hasil dari mengganti pemahaman subjek lain tentang masalah untuk diri sendiri. . Tidak jelas bahwa seseorang menjadi kurang subyektif dengan cara ini, tetapi mungkin terasa seperti itu. Saya pikir sebagian besar akan setuju bahwa itu tidak membantu.
sumber
Subjektivitas dalam pendekatan frequentist merajalela dalam penerapan inferensi. Ketika Anda menguji hipotesis Anda menetapkan tingkat kepercayaan, katakanlah 95% atau 99%. Dari mana ini berasal? Itu tidak datang dari mana pun tetapi preferensi Anda sendiri atau praktik yang berlaku di bidang Anda.
Bayesian sebelumnya sangat sedikit pada dataset besar, karena ketika Anda memperbaruinya dengan data, distribusi posterior akan melayang jauh dari sebelumnya karena semakin banyak data yang diproses.
Setelah mengatakan bahwa Bayesian mulai dari definisi subjektif dari probabilitas, kepercayaan dll. Ini membuat mereka berbeda dari frequentis, yang berpikir dalam hal probabilitas obyektif. Dalam set data kecil ini membuat perbedaan
UPDATE: Saya harap Anda membenci filsafat seperti saya, tetapi mereka memiliki pemikiran yang menarik dari waktu ke waktu, pertimbangkan subjektivisme . Bagaimana saya tahu bahwa saya benar-benar di SE? Bagaimana jika itu mimpiku? dll :)
sumber