Dalam analisis data Bayesian, parameter diperlakukan sebagai variabel acak. Ini berasal dari konseptualisasi subjektif subjektif Bayesian. Tetapi apakah Bayesian secara teori mengakui bahwa ada satu nilai parameter tetap yang benar di 'dunia nyata?'
Sepertinya jawaban yang jelas adalah 'ya', karena kemudian mencoba memperkirakan parameternya hampir tidak masuk akal. Kutipan akademik untuk jawaban ini akan sangat dihargai.
Jawaban:
IMHO "ya"! Berikut adalah salah satu kutipan favorit saya oleh Greenland (2006: 767):
Greenland, S. (2006). Perspektif Bayesian untuk penelitian epidemiologi: I. Yayasan dan metode dasar. International Journal of Epidemiology , 35 (3), 765-774.
sumber
Konsepsi Bayes tentang probabilitas tidak selalu subjektif (lih. Jaynes). Perbedaan penting di sini adalah bahwa Bayesian mencoba untuk menentukan status pengetahuannya tentang nilai parameter dengan menggabungkan distribusi sebelumnya untuk nilai yang masuk akal dengan kemungkinan yang merangkum informasi yang terkandung dalam beberapa pengamatan. Oleh karena itu, sebagai seorang Bayesian, saya akan mengatakan bahwa saya senang dengan gagasan bahwa parameter memiliki nilai sebenarnya, yang tidak diketahui secara pasti, dan tujuan dari distribusi posterior adalah untuk meringkas apa yang saya ketahui tentang nilai-nilai yang masuk akal, berdasarkan asumsi dan pengamatan saya sebelumnya.
Sekarang, ketika saya membuat model, model itu bukan kenyataan. Jadi dalam beberapa kasus, parameter yang dipermasalahkan memang ada dalam kenyataan (mis. Berat rata-rata wombat) dan dalam beberapa pertanyaan tidak (misalnya nilai sebenarnya dari parameter regresi - model regresi hanya merupakan model hasil dari hukum fisik yang mengatur sistem, yang mungkin tidak sepenuhnya ditangkap oleh model regresi). Jadi untuk mengatakan bahwa ada satu nilai parameter tetap yang benar di dunia nyata belum tentu benar.
Di sisi lain, saya akan menyarankan bahwa kebanyakan frequentist akan mengatakan ada satu nilai sebenarnya untuk statistik, tetapi mereka tidak tahu apa itu baik, tetapi mereka memiliki estimator untuk itu dan interval kepercayaan pada estimasi mereka yang (dalam arti ) mengkuantifikasi ketidakpastian mereka mengenai kemungkinan masuknya nilai yang berbeda (tetapi konsepsi probabilitas yang sering mencegah mereka untuk mengungkapkannya secara langsung).
sumber
Untuk poin utama Anda, di Bayesian Data Analysis (edisi ke-3, 93), Gelman juga menulis
Jadi mungkin bukan orang Bayesian yang harus "mengakui" bahwa ada, pada kenyataannya, nilai parameter nyata tunggal, tetapi sering yang harus menarik statistik Bayesian untuk membenarkan prosedur estimasi mereka! (Saya mengatakan ini dengan lidah tegas di pipi.)
Tetapi gagasan bahwa ada parameter tunggal di alam atau dalam sistem sosial hanyalah asumsi yang disederhanakan. Mungkin ada beberapa proses hiasan menghasilkan hasil yang dapat diamati, tetapi menemukan bahwa sistem itu sangat rumit; seandainya ada satu nilai parameter tetap menyederhanakan masalah secara dramatis. Saya pikir ini memotong inti pertanyaan Anda: Bayesian seharusnya tidak harus "mengakui" untuk membuat penyederhanaan ini lebih dari yang seharusnya dilakukan oleh kaum Frequentists.
sumber
Apakah Anda berpikir bahwa ada "parameter tetap sejati" tunggal untuk sesuatu seperti kontribusi minum susu untuk pertumbuhan anak? Atau untuk penurunan ukuran tumor berdasarkan jumlah bahan kimia X yang Anda suntikkan ke dalam tubuh pasien? Pilih model apa pun yang Anda kenal dan tanyakan pada diri Anda apakah Anda benar-benar percaya bahwa ada satu nilai yang benar, universal, tepat dan tetap untuk setiap parameter, bahkan dalam teori.
Abaikan kesalahan pengukuran, lihat saja model Anda seolah-olah semua pengukuran sangat akurat dan sangat akurat. Dengan model Anda, apakah menurut Anda setiap parameter secara realistis memiliki nilai titik tertentu?
Fakta bahwa Anda memiliki model menunjukkan bahwa Anda meninggalkan beberapa detail. Model Anda akan memiliki sejumlah ketidaktepatan karena Anda rata-rata atas parameter / variabel yang Anda tinggalkan untuk membuat model - representasi kenyataan yang disederhanakan. (Sama seperti Anda tidak membuat peta planet 1: 1, lengkapi dengan semua detail, melainkan peta 1: 10000000, atau penyederhanaan semacam itu. Peta itu adalah model.)
Karena Anda rata-rata melintasi variabel yang ditinggalkan, parameter untuk variabel yang Anda sertakan dalam model Anda akan berupa distribusi, bukan nilai titik.
Itu hanya bagian dari filosofi Bayesian - saya mengabaikan ketidakpastian teoretis, ketidakpastian pengukuran, prior, dll - tetapi bagi saya gagasan bahwa parameter Anda memiliki distribusi masuk akal, seperti halnya statistik deskriptif memiliki distribusi.
sumber
sumber
Jika kita pergi dan memasangkan Bayesianisme dengan alam semesta deterministik (sebelum Anda mengatakan apa pun dengan kata 'kuantum' di dalamnya, beri humor dan ingatlah bahwa ini bukan fisika. Pertukaran pertukaran) kita mendapatkan beberapa hasil menarik.
Membuat asumsi kami eksplisit:
Sekarang, alam semesta deterministik mungkin satu di mana atom adalah bola bilyar kecil newton. Mungkin sepenuhnya non-kuantum. Katakan saja begitu.
Agen sekarang membalik koin yang adil. Pikirkan tentang hal itu sejenak, apa yang terbentuk dari koin yang adil di dunia deterministik? Koin yang memiliki rasio probabilitas 50/50?
Tapi itu deterministik! Dengan daya komputasi yang cukup Anda dapat menghitung dengan tepat bagaimana koin akan mendarat, murni dengan mensimulasikan model koin yang diputar dengan cara yang sama.
Dalam dunia deterministik, koin yang adil akan menjadi cakram logam dengan kerapatan seragam. Tidak ada kekuatan yang memaksanya menghabiskan lebih banyak waktu dengan satu wajah menghadap ke bawah dari yang lain (pikirkan tentang bagaimana fungsi dadu berbobot.)
Jadi agen membalik koin yang adil. Namun, agen itu tidak cukup kuat. Itu tidak memiliki mata yang cukup tajam untuk mengukur bagaimana koin berputar ketika dibalik, ia melihat tetapi kabur.
Dan begitulah katanya, "Koin ini akan mendaratkan kepala dengan probabilitas 50%." Kurangnya informasi menyebabkan kemungkinan.
Kita dapat melihat ruang fase bagaimana koin dilemparkan. Sistem koordinat multidimensi besar dengan sumbu yang berkaitan dengan arah lemparan, gaya lemparan, putaran koin, kecepatan dan arah angin, dan sebagainya. Satu titik dalam ruang ini sesuai dengan satu kemungkinan coinflip.
Jika kita meminta agen dari sebelumnya untuk mewarnai dalam sistem koordinat dengan gradien skala abu-abu yang sesuai dengan penugasan agen tentang kemungkinan kepala untuk setiap lemparan yang diberikan, itu akan paling mewarnai semua warna abu-abu yang seragam.
Jika kita secara bertahap memberikannya komputer internal yang lebih kuat yang dapat digunakan untuk menghitung probabilitas kepala, ia akan dapat membuat pewarnaan yang semakin tajam. Ketika kita akhirnya memberikannya komputer internal yang paling kuat, membuatnya mahatahu, itu akan secara efektif melukis kotak-kotak aneh.
Koin yang adil tidak terbuat dari probabilitas, mereka terbuat dari logam. Peluang hanya ada dalam struktur komputasi. Demikian kata Bayesian.
sumber
Ada prior yang tidak tepat, misalnya Jeffreys, yang memiliki hubungan tertentu dengan matriks Informasi Fishers. Maka itu tidak subyektif.
sumber