Dalam sebuah komentar yang baru-baru ini diposting di sini, seorang komentator menunjuk ke sebuah blog oleh Larry Wasserman yang menunjukkan (tanpa sumber) yang sering berselisih dengan prinsip kemungkinan.
Prinsip kemungkinan hanya mengatakan bahwa percobaan menghasilkan fungsi kemungkinan yang sama harus menghasilkan kesimpulan yang sama.
Dua bagian dari pertanyaan ini:
Bagian, citarasa atau aliran kesimpulan sering yang secara khusus melanggar prinsip kemungkinan?
Jika ada bentrokan, apakah kita harus membuang yang satu atau yang lain? Jika demikian, lalu yang mana? Saya akan demi diskusi menyarankan bahwa jika kita harus membuang sesuatu maka kita harus membuang bagian-bagian dari kesimpulan sering yang bertabrakan, karena Hacking dan Royall telah meyakinkan saya bahwa prinsip kemungkinan adalah aksiomatik.
sumber
Jawaban:
Bagian dari pendekatan Frequentist yang bertentangan dengan prinsip kemungkinan adalah teori pengujian statistik (dan perhitungan p-value). Biasanya disorot oleh contoh berikut.
Misalkan dua Frequentist ingin mempelajari koin bias, yang mengubah 'kepala' dengan kemungkinan tidak diketahui . Mereka menduga itu bias terhadap 'ekor', sehingga mereka mendalilkan hipotesis nol yang sama dan hipotesis alternatif yang sama .p = 1 / 2 p < 1 / 2hal p = 1 / 2 p < 1 / 2
Ahli statistik pertama membalik koin sampai 'kepala' muncul, yang terjadi menjadi 6 kali. Yang kedua memutuskan untuk membalik koin 6 kali, dan hanya mendapatkan satu 'kepala' di lemparan terakhir.
Menurut model ahli statistik pertama, nilai-p dihitung sebagai berikut:
Menurut model ahli statistik kedua, nilai-p dihitung sebagai berikut:
Mengganti dengan , yang pertama menemukan nilai-p sama dengan , yang kedua menemukan nilai-p sama dengan .1 / 2 1 / 2 5 = 0,03125hal 1 / 2 1 / 25= 0,03125 7 / 2 × 1 / 25= 0,109375
Jadi, mereka mendapatkan hasil yang berbeda karena mereka melakukan hal yang berbeda, bukan? Tetapi menurut prinsip kemungkinan , mereka harus sampai pada kesimpulan yang sama. Secara singkat, prinsip kemungkinan menyatakan bahwa kemungkinan itulah yang penting untuk disimpulkan. Jadi perselisihan di sini berasal dari fakta bahwa kedua pengamatan memiliki kemungkinan yang sama, sebanding dengan (kemungkinan ditentukan hingga konstanta proporsionalitas).p ( 1 - p )5
Sejauh yang saya tahu, jawaban untuk pertanyaan kedua Anda lebih merupakan pendapat yang diperdebatkan. Saya pribadi mencoba menghindari melakukan tes dan menghitung nilai-p untuk alasan di atas, dan untuk yang lain dijelaskan dalam posting blog ini .
EDIT: Sekarang saya memikirkannya, estimasi dengan interval kepercayaan juga akan berbeda. Sebenarnya jika modelnya berbeda, CI berbeda dengan konstruksi.hal
sumber
Saya suka contoh oleh @ gui11aume (+1), tetapi ini dapat membuat kesan bahwa perbedaan dalam dua nilai- muncul hanya karena perbedaan aturan penghentian yang digunakan oleh kedua peneliti.p
Faktanya, saya percaya ini adalah fenomena yang jauh lebih umum. Pertimbangkan eksperimen kedua dalam jawaban @ gui11aume: orang yang melempar koin enam kali dan mengamati kepala hanya pada lemparan terakhir. Hasilnya terlihat seperti itu: berapakah nilai- ? Pendekatan yang biasa dilakukan adalah menghitung probabilitas bahwa koin yang adil akan menghasilkan satu atau lebih sedikit kepala. Ada kemungkinan dari total dengan satu atau kurang kepala, karenanya .p 7 64 p = 7 / 64 ≈ 0,109
Tetapi mengapa tidak mengambil statistik tes lain ? Sebagai contoh, dalam percobaan ini kami mengamati lima ekor berturut-turut. Mari kita ambil urutan panjang ekor terpanjang sebagai statistik uji. Ada kemungkinan dengan lima atau enam ekor berturut-turut, maka .p = 3 / 64 ≈ 0.0473 p=3/64≈0.047
Jadi jika dalam kasus ini tingkat kesalahan ditetapkan pada , maka pilihan statistik uji dapat dengan mudah memberikan hasil yang signifikan atau tidak, dan ini tidak ada hubungannya dengan aturan penghentian per se .α=0.05
Bagian spekulatif
Sekarang, secara filosofis, saya akan mengatakan bahwa pilihan yang sering dari statistik uji dalam beberapa pengertian yang mirip dengan pilihan Bayesian sebelumnya. Kami memilih satu atau beberapa statistik uji karena kami percaya bahwa koin yang tidak adil akan berperilaku dengan cara ini atau itu (dan kami ingin memiliki kekuatan untuk mendeteksi perilaku ini). Bukankah ini mirip dengan memprioritaskan jenis koin?
Jika demikian, maka prinsip kemungkinan mengatakan bahwa semua bukti ada dalam kemungkinan tidak bertentangan dengan nilai- , karena nilai- maka tidak hanya "jumlah bukti". Itu adalah "ukuran kejutan", tetapi sesuatu hanya bisa menjadi ukuran kejutan jika itu menjelaskan apa yang akan membuat kita terkejut! Nilai mencoba untuk menggabungkan dalam satu skalar kuantitas baik bukti dan semacam harapan sebelumnya (sebagaimana diwakili dalam pilihan statistik uji). Jika demikian, maka itu tidak boleh dibandingkan dengan kemungkinan itu sendiri, tetapi mungkin lebih ke posterior?p pp p p
Saya akan sangat tertarik untuk mendengar beberapa pendapat tentang bagian spekulatif ini, di sini atau dalam obrolan.
Perbarui diskusi berikut dengan @MichaelLew
Saya takut contoh saya di atas tidak cocok dengan pokok perdebatan ini. Memilih statistik uji yang berbeda mengarah ke perubahan fungsi kemungkinan juga. Jadi dua nilai- berbeda yang dihitung di atas sesuai dengan dua fungsi kemungkinan yang berbeda, dan karenanya tidak bisa menjadi contoh "bentrokan" antara prinsip kemungkinan dan nilai- . Keindahan dari contoh @ gui11aume adalah bahwa fungsi kemungkinan tetap sama persis, meskipun nilai- berbeda.p pp p p
Saya masih harus memikirkan apa artinya ini bagi bagian "spekulatif" saya di atas.
sumber