Subjektivitas dalam Statistik Frequentist

Saya sering mendengar klaim bahwa statistik Bayesian bisa sangat subjektif. Argumen utama adalah bahwa inferensi tergantung pada pilihan prior (walaupun seseorang dapat menggunakan prinsip indiferensi o entropi maksimum untuk memilih prior). Sebagai perbandingan, klaim berjalan, statistik frequentist secara umum lebih objektif. Berapa banyak kebenaran dalam pernyataan ini?

Juga, ini membuat saya bertanya-tanya:

Apa elemen konkret dari statistik frequentist (jika ada) yang bisa sangat subjektif dan yang tidak ada atau kurang penting dalam statistik Bayesian?
Apakah subjektivitas lebih umum di Bayesian daripada dalam statistik frequentist?

bayesian interpretation frequentist philosophical Amelio Vazquez-Reina
sumber

Tentu saja metode frequentist jauh lebih subjektif daripada yang diiklankan, tetapi saya berpendapat bahwa metode Bayesian masih lebih subyektif. Dan tolong jangan meyakinkan diri Anda bahwa invarian dari prior Anda di bawah grup atau spesifikasi dari MaxEnt prior entah bagaimana "obyektif" - kedua tipe yang sebelumnya berpotensi mengungkapkan kepercayaan yang saya anggap informatif, dan bagaimanapun juga strategi tidak dapat diterapkan secara umum sepenuhnya (misalnya saya tidak berpikir ada prior atau MaxEnt prior pada ruang CDF, dan apapun sebelumnya pada ruang ini menetapkan probabilitas 1 ke set sedikit topologi).

pria

Bayesian memulai dari dasar subjektif, kemudian data (semoga) menarik mereka kembali ke realitas objektif. Para frekuensi sering memulai (atau setidaknya berpikir bahwa mereka melakukannya) dari posisi objektif, tetapi kemudian mereka mencemari analisis dengan asumsi subjektif mereka.

Aksakal

Orang Bayesian sama-sama tahu dan di depan dengan asumsi mereka. Kaum frekuensi pada umumnya tidak.

Alexis

Jawaban:

Saya sering mendengar klaim bahwa statistik Bayesian bisa sangat subjektif.

Aku juga. Tapi perhatikan bahwa ada ambiguitas utama dalam menyebut sesuatu subjektif.

Subjektivitas (kedua indera)

Subyektif dapat berarti (setidaknya) salah satu dari

tergantung pada keanehan peneliti
secara eksplisit berkaitan dengan keadaan pengetahuan seseorang

Bayesianisme adalah subyektif dalam arti kedua karena selalu menawarkan cara untuk memperbarui kepercayaan yang diwakili oleh distribusi probabilitas dengan mengkondisikan informasi. (Catatan bahwa apakah mereka keyakinan adalah keyakinan bahwa beberapa subjek sebenarnya memiliki atau hanya keyakinan bahwa subjek bisa miliki adalah tidak relevan untuk memutuskan apakah itu adalah 'subjektif'.)

Argumen utama adalah bahwa inferensi tergantung pada pilihan sebelumnya

Sebenarnya, jika prior mewakili kepercayaan pribadi Anda tentang sesuatu, maka Anda hampir pasti tidak memilihnya sama seperti Anda memilih sebagian besar keyakinan Anda. Dan jika itu mewakili kepercayaan seseorang maka itu bisa menjadi representasi yang kurang lebih akurat dari kepercayaan itu, jadi ironisnya akan ada fakta 'obyektif' tentang seberapa baik itu mewakili mereka.

(meskipun orang dapat menggunakan prinsip ketidakpedulian atau entropi maksimum untuk memilih yang sebelumnya).

Orang bisa, meskipun ini tidak cenderung menggeneralisasi dengan sangat lancar ke domain kontinu. Juga, bisa dibilang tidak mungkin menjadi datar atau 'acuh tak acuh' di semua parameterisasi sekaligus (walaupun saya tidak pernah yakin mengapa Anda ingin menjadi).

Sebagai perbandingan, klaim berjalan, statistik frequentist secara umum lebih objektif. Berapa banyak kebenaran dalam pernyataan ini?

Jadi bagaimana kita mengevaluasi klaim ini?

Saya menyarankan bahwa dalam pengertian kedua subyektif: sebagian besar benar. Dan dalam arti subyektif pertama: itu mungkin salah.

Frekuensi sebagai subyektif (pengertian kedua)

Beberapa detail historis bermanfaat untuk memetakan masalah

Untuk Neyman dan Pearson hanya ada perilaku induktif bukan inferensi induktif dan semua evaluasi statistik bekerja dengan sifat sampling jangka panjang dari penduga. (Karenanya analisis alpha dan kekuatan, tetapi tidak nilai p). Itu cukup tidak subyektif dalam kedua pengertian.

Memang itu mungkin, dan saya pikir cukup masuk akal, untuk berdebat di bawah ini bahwa Frequentism sebenarnya bukan kerangka inferensi sama sekali, melainkan kumpulan kriteria evaluasi untuk semua prosedur inferensi yang mungkin yang menekankan perilaku mereka dalam aplikasi berulang. Contoh-contoh sederhana adalah konsistensi, ketidakberpihakan, dll. Ini membuatnya jelas tidak subyektif dalam pengertian 2. Namun, juga berisiko menjadi subyektif dalam arti 1 ketika kita harus memutuskan apa yang harus dilakukan ketika krteria itu tidak berlaku (misalnya ketika tidak ada penaksir yang tidak bias untuk dimiliki) atau ketika mereka berlaku tetapi bertentangan.

Fisher menawarkan Frequentism yang kurang subyektif yang menarik. Untuk Fisher, ada yang namanya inferensi induktif, dalam arti bahwa subjek, ilmuwan, membuat kesimpulan berdasarkan analisis data, yang dilakukan oleh ahli statistik. (Karenanya nilai-p tetapi bukan analisis alfa dan daya). Namun, keputusan tentang bagaimana berperilaku, apakah akan melanjutkan penelitian dll dibuat oleh ilmuwan berdasarkan pemahamannya tentang teori domain, bukan oleh ahli statistik yang menerapkan paradigma inferensi. Karena pembagian kerja nelayan ini, baik subjektivitas (indera 2) dan subjek individu (indera 1) duduk di sisi sains, bukan sisi statistik.

Berbicara secara hukum, Frequentism Fisher adalah subyektif. Hanya saja subjek yang subjektif bukan ahli statistik.

Ada berbagai sintesis yang tersedia, baik campuran yang nyaris tidak koheren dari keduanya yang Anda temukan dalam buku teks statistik terapan dan versi yang lebih bernuansa, misalnya 'Statistik Kesalahan' yang didorong oleh Deborah Mayo. Yang terakhir ini cukup tidak subyektif dalam pengertian 2, tetapi sangat subyektif dalam arti 1, karena peneliti harus menggunakan penilaian ilmiah - gaya Fisher - untuk mencari tahu apa probabilitas kesalahan itu penting dan harus diuji.

Frequentism sebagai subyektif (first sense)

Jadi apakah Frequentism kurang subyektif dalam arti pertama? Tergantung. Setiap prosedur inferensi dapat diliputi dengan kekhasan sebagai benar-benar diterapkan. Jadi mungkin lebih berguna untuk bertanya apakah Frequentism mendorong pendekatan yang kurang subyektif (pertama)? Saya ragu - saya pikir penerapan metode subyektif (indra kedua) secara sadar mengarah pada hasil yang kurang subyektif (indra pertama), tetapi bisa dibantah.

Asumsikan sejenak bahwa subjektivitas (pengertian pertama) menyelinap ke dalam analisis melalui 'pilihan'. Bayesianisme tampaknya melibatkan lebih banyak 'pilihan'. Dalam kasus yang paling sederhana, pilihan dihitung sebagai: satu set asumsi yang berpotensi istimewa untuk Frequentist (fungsi Likelihood atau yang setara) dan dua set untuk Bayesian (Kemungkinan dan sebelumnya dari yang tidak diketahui).

Namun, orang Bayesian tahu bahwa mereka bersikap subyektif (dalam arti kedua) tentang semua pilihan ini sehingga mereka cenderung lebih sadar diri tentang implikasi yang seharusnya mengarah pada kurang subjektivitas (dalam arti pertama).

Sebaliknya, jika seseorang melihat sebuah tes dalam buku besar tes, maka orang bisa mendapatkan perasaan bahwa hasilnya kurang subyektif (indra pertama), tetapi bisa dibilang itu adalah hasil dari mengganti pemahaman subjek lain tentang masalah untuk diri sendiri. . Tidak jelas bahwa seseorang menjadi kurang subyektif dengan cara ini, tetapi mungkin terasa seperti itu. Saya pikir sebagian besar akan setuju bahwa itu tidak membantu.

conjugateprior
sumber

Definisi kamus 'subjektif' (langsung dari Google) mengatakan: berdasarkan atau dipengaruhi oleh perasaan, selera, atau pendapat pribadi. mis. "pandangannya sangat subyektif" sinonim: personal, personal, individu, internal, emosional, naluriah, intuitif, impresionistik . Perhatikan bahwa ini mencerminkan teori rakyat bahwa 'pandangan' (yaitu keyakinan) adalah subyektif (pengertian 1: impresionistik, intuitif, aneh, dll.) Karena menyangkut keadaan internal subjek tertentu (pengertian 2: personalisasi, individu, dll. .) Daripada menjadi publik yaitu impersonal .

conjugateprior

Mungkin bermanfaat untuk berpikir tentang psikologi kognitif sebagai contoh. Bidang ini sepenuhnya subyektif (dalam pengertian kedua, karena ini semua tentang keadaan internal orang dan pengaruhnya terhadap perilaku orang-orang itu) tetapi ini bukan subyektif dalam pengertian pertama, karena psikolog tidak dapat benar-benar hanya duduk dan mengada-ada dasar keadaan internal mereka sendiri.

conjugateprior

Ekstrem yang berlawanan, di mana sesuatu benar-benar istimewa dan subjektif (pengertian 1) tetapi tidak benar-benar tentang subjek sama sekali sulit untuk ditemukan. Mungkin Lucretius menjelaskan atom dan kekosongan dalam de Rerum Naturae adalah contohnya.

conjugateprior

Persis. Bahasa Inggris tidak membantu tentang hal ini ...

conjugateprior

dan saya telah menyetujui (dan sedikit menyesuaikan) perubahan yang diusulkan

conjugateprior

Subjektivitas dalam pendekatan frequentist merajalela dalam penerapan inferensi. Ketika Anda menguji hipotesis Anda menetapkan tingkat kepercayaan, katakanlah 95% atau 99%. Dari mana ini berasal? Itu tidak datang dari mana pun tetapi preferensi Anda sendiri atau praktik yang berlaku di bidang Anda.

Bayesian sebelumnya sangat sedikit pada dataset besar, karena ketika Anda memperbaruinya dengan data, distribusi posterior akan melayang jauh dari sebelumnya karena semakin banyak data yang diproses.

Setelah mengatakan bahwa Bayesian mulai dari definisi subjektif dari probabilitas, kepercayaan dll. Ini membuat mereka berbeda dari frequentis, yang berpikir dalam hal probabilitas obyektif. Dalam set data kecil ini membuat perbedaan

UPDATE: Saya harap Anda membenci filsafat seperti saya, tetapi mereka memiliki pemikiran yang menarik dari waktu ke waktu, pertimbangkan subjektivisme . Bagaimana saya tahu bahwa saya benar-benar di SE? Bagaimana jika itu mimpiku? dll :)

Aksakal
sumber

Selain pilihan tingkat kepercayaan dalam pengujian hipotesis (karena hal yang sama dapat diperdebatkan dalam statistik Bayesian, misalnya, ketika memilih kriteria untuk membandingkan HDP / HDI dengan ROPE untuk menolak atau menerima hipotesis ), apakah subjektivitas berperan dalam mendapatkan estimasi titik atau mendapatkan interval kepercayaan, mungkin dalam memilih estimator?

Amelio Vazquez-Reina

Juga, pemahaman saya adalah bahwa tingkat signifikansi ditetapkan dalam statistik Frequentist dalam konteks pengambilan keputusan (yaitu apakah kita harus menolak hipotesis nol?), Bukan dalam menghitung probabilitas. Dalam teori keputusan Bayesian hal yang sama dapat diperdebatkan tentang pilihan fungsi Rugi, yang dapat mempengaruhi keputusan (dipilih) yang optimal. Selain itu, nilai-nilai tingkat kepercayaan biasanya dipilih dari tingkat kesalahan tipe I yang dapat diterima (mis. 95% di NHST secara langsung ditetapkan dari tingkat positif palsu "tidak lebih tinggi dari 5%")

Amelio Vazquez-Reina

n \to \infty

$n \to \infty$

p ≪ n

$p \ll n$

p \to \infty

$p \to \infty$

n

$n$

Mungkin perlu dicatat bahwa fungsi kerugian mungkin tidak subyektif (yaitu, sepenuhnya ditentukan oleh konteksnya), dalam hal ini keputusan optimal Bayesian memiliki potensi untuk menjadi sepenuhnya objektif terpisah dari yang sebelumnya.

α

$\alpha$