Mengapa cut-off digunakan untuk faktor Bayes dan nilai-p sangat berbeda?

11

Saya mencoba memahami Bayes Factor (BF). Saya percaya mereka seperti rasio kemungkinan dari 2 hipotesis. Jadi, jika BF 5, itu berarti H1 5 kali lebih mungkin daripada H0. Dan nilai 3-10 menunjukkan bukti sedang, sedangkan> 10 menunjukkan bukti kuat.

Namun, untuk nilai-P, 0,05 tradisional dianggap sebagai cut-off. Pada nilai P ini, rasio kemungkinan H1 / H0 harus sekitar 95/5 atau 19.

Jadi mengapa cut-off> 3 diambil untuk BF sedangkan cut-off> 19 diambil untuk nilai P? Nilai-nilai ini juga tidak dekat.

juga
sumber
2
Saya tidak nyaman dengan mengatakan "jika BF adalah , artinya adalah kali lebih mungkin dibandingkan ". Faktor Bayes mungkin merupakan rasio kemungkinan marjinal, tetapi ini bukan rasio probabilitas atau rasio peluang, dan perlu digabungkan dengan yang sebelumnya bergunaH 1 5 H 05H15H0
Henry
Jika kita tidak memiliki informasi khusus sebelumnya, lalu apa yang bisa kita katakan tentang makna BF?
rnso
Tentu saja, seseorang memiliki "beberapa" informasi sebelumnya bahkan jika mengatakan bahwa tidak ada info sebelumnya. Yaitu, dalam hal ini masuk akal untuk menetapkan probabilitas yang sama untuk setiap hipotesis sesuai dengan prinsip ketidakpedulian. Itu adalah contoh sederhana dari apa yang disebut sebelumnya non-informatif (diakui keliru).
dnqxt
Dalam hal ini akankah BF dari 5 mengindikasikan satu hipotesis menjadi 5x lebih mungkin?
rnso
Ya, tetapi masalah ini jauh lebih rumit daripada yang terlihat dan masuk ke bidang pemilihan model dalam statistik. Anda telah diperingatkan :))
dnqxt

Jawaban:

10

Beberapa hal:

BF memberi Anda bukti yang mendukung hipotesis, sementara uji hipotesis frequentist memberi Anda bukti terhadap hipotesis (nol). Jadi itu semacam "apel untuk jeruk."

Kedua prosedur ini, terlepas dari perbedaan interpretasi, dapat mengarah pada keputusan yang berbeda. Misalnya, BF mungkin menolak sementara tes hipotesis frequentist tidak, atau sebaliknya. Masalah ini sering disebut sebagai paradoks Jeffreys-Lindley . Ada banyak posting di situs ini tentang ini; lihat misalnya di sini , dan di sini .

"Pada nilai P ini, kemungkinan H1 / H0 seharusnya 95/5 atau 19." Tidak, ini tidak benar karena, kira-kira p(yH1)1p(yH0) . Menghitung nilai-p dan melakukan tes yang sering, setidaknya, tidak mengharuskan Anda memiliki ide tentang p(yH1) . Juga, nilai-p sering integral / jumlah kepadatan / pmfs, sementara BF tidak berintegrasi pada ruang sampel data.

Taylor
sumber
2
Taylor mengatakan ambang batas untuk bukti terhadap satu hipotesis ( ) tidak dapat secara langsung dibandingkan dengan ambang bukti untuk hipotesis lain ( H 1 ), juga tidak kurang. Ketika Anda berhenti percaya pada efek nol tidak perlu berhubungan dengan ketika Anda mulai percaya pada suatu alternatif. Inilah mengapa nilai- p tidak boleh ditafsirkan sebagai 1 - ( kepercayaan pada H 1 )H0H1p1(belief in H1)
Frans Rodenburg
1
Mungkin ini bisa mengklarifikasi: en.wikipedia.org/wiki/Misunderstandings_of_p-values -value sering bukanlah ukuran bukti untuk apa pun. p
Frans Rodenburg
2
Maaf, komentar terakhir: Alasan Anda tidak dapat melihatnya sebagai bukti yang mendukung adalah bahwa ini adalah kesempatan untuk mengamati ukuran efek sebesar ini jika H 0 benar. Jika H 0 memang benar, nilai p- harus acak acak, sehingga nilainya tidak memiliki arti pada probabilitas H 1 . Kehalusan dalam interpretasi ini adalah dengan cara salah satu alasan nilai- p melihat begitu banyak penyalahgunaan. H1 H0H0pH1p
Frans Rodenburg
1
@ Benxyzzy: distribusi nilai- hanya seragam di bawah hipotesis nol, bukan di bawah alternatif di mana ia sangat condong ke nol. p
Xi'an
1
@ Benxyzzy Untuk menambahkan kepada orang lain: Titik menggunakan nilai adalah bahwa di bawah hipotesis nol itu acak acak, jadi jika Anda mendapatkan nilai p sangat kecil , itu mengisyaratkan bahwa mungkin itu tidak acak acak jadi mungkin nol hipotesis itu tidak benar. pp
JiK
8

The Bayes Faktor B01 dapat berubah menjadi probabilitas di bawah bobot yang sama sebagai

P01=11+1B01
p

  1. P01
  2. nilai dan berbagai tergantung pada pilihan ukuran sebelumnya, mereka sehingga relatif bukan absolut (dan menyebutkan Taylor dari paradoks Lindley-Jeffreys sesuai pada tahap ini )
  3. B01P01

p p

Q01=P(B01(X)B01(xobs))
xobsX
XΘf(x|θ)π(θ|xobs)dθ

Xi'an
sumber
Dengan menggunakan rumus Anda, P untuk BF 3 dan 10 masing-masing menjadi 0,75 dan 0,91. Mengapa kita harus menerima ini sebagai bukti moderat karena untuk nilai P kita tetap memotong 0,95?
rnso
0.95
Rumusnya terlihat lebih sederhana sebagaiP = B/(B+1)
rnso
2

Beberapa kebingungan Anda mungkin berasal dari mengambil angka 95/5 langsung dari fakta bahwa nilai p adalah 0,05 - apakah ini yang Anda lakukan? Saya tidak percaya ini benar. Nilai p untuk uji-t, misalnya, mencerminkan peluang untuk mendapatkan perbedaan yang diamati antara rata-rata atau perbedaan yang lebih ekstrim jika hipotesis nol sebenarnya benar. Jika Anda mendapatkan nilai ap 0,02, Anda mengatakan 'ah, hanya ada 2% peluang untuk mendapatkan perbedaan seperti ini, atau perbedaan yang lebih besar, jika nol benar. Tampaknya sangat mustahil, jadi saya mengusulkan bahwa nol itu tidak benar! '. Angka-angka ini bukan hal yang sama yang masuk ke dalam faktor Bayes, yang merupakan rasio probabilitas posterior yang diberikan untuk setiap hipotesis yang bersaing. Probabilitas posterior ini tidak dihitung dengan cara yang sama dengan nilai-p,

Sebagai catatan, saya akan menyarankan sangat menjaga terhadap berpikir nilai-nilai BF yang berbeda sebagai hal-hal tertentu yang berarti. Penugasan ini sepenuhnya arbitrer, seperti tingkat signifikansi 0,05. Masalah seperti peretasan akan terjadi seperti halnya dengan Bayes Factors jika orang mulai percaya bahwa hanya angka-angka tertentu yang perlu dipertimbangkan. Cobalah untuk memahami mereka apa adanya, yang merupakan probabilitas relatif, dan gunakan akal Anda sendiri untuk menentukan apakah Anda menemukan nomor BF bukti yang meyakinkan atau tidak.

Jamie
sumber