Apakah koreksi Bonferroni terlalu anti-konservatif / liberal untuk beberapa hipotesis dependen?

8

Saya sering membaca bahwa koreksi Bonferroni juga berfungsi untuk hipotesis dependen. Namun, saya tidak berpikir itu benar dan saya punya contoh balasan. Dapatkah seseorang tolong beri tahu saya (a) di mana kesalahan saya atau (b) apakah saya benar dalam hal ini.

Menyiapkan contoh penghitung

Asumsikan kita sedang menguji dua hipotesis. Misalkan adalah hipotesis pertama salah dan sebaliknya. Tetapkan cara yang sama. Biarkan menjadi nilai-p yang terkait dengan dua hipotesis dan biarkan Menunjukkan fungsi indikator untuk set yang ditentukan di dalam kurung.H1=0H1=1H2p1,p2[[]]

Untuk fix define yang jelas merupakan kepadatan probabilitas lebih dari . Ini adalah plot dari dua kepadatanθ[0,1]

P(p1,p2|H1=0,H2=0)=12θ[[0p1θ]]+12θ[[0p2θ]]P(p1,p2|H1=0,H2=1)=P(p1,p2|H1=1,H2=0)=1(1θ)2[[θp11]][[θp21]]
[0,1]2

masukkan deskripsi gambar di sini

Hasil marginalisasi dan demikian pula untuk .

P(p1|H1=0,H2=0)=12θ[[0p1θ]]+12P(p1|H1=0,H2=1)=1(1θ)[[θp11]]
p2

Selanjutnya, mari Ini menyiratkan bahwa

P(H2=0|H1=0)=P(H1=0|H2=0)=2θ1+θP(H2=1|H1=0)=P(H1=1|H2=0)=1θ1+θ.
P(p1|H1=0)=h2{0,1}P(p1|H1=0,h2)P(h2|H1=0)=12θ[[0p1θ]]2θ1+θ+122θ1+θ+1(1θ)[[θp11]]1θ1+θ=11+θ[[0p1θ]]+θ1+θ+11+θ[[θp11]]=U[0,1]
seragam seperti yang diperlukan untuk nilai-p di bawah hipotesis Null. Hal yang sama berlaku untuk karena simetri.p2

Untuk mendapatkan distribusi gabungan kami menghitungP(H1,H2)

P(H2=0|H1=0)P(H1=0)=P(H1=0|H2=0)P(H2=0)2θ1+θP(H1=0)=2θ1+θP(H2=0)P(H1=0)=P(H2=0):=q
Oleh karena itu, distribusi gabungan diberikan oleh yang berarti .
P(H1,H2)=H2=0H2=1H1=02θ1+θq1θ1+θqH1=11θ1+θq1+θ2q1+θ
0q1+θ2

Mengapa itu adalah contoh balasan

Sekarang mari untuk tingkat signifikansi menarik. Probabilitas untuk mendapatkan setidaknya satu false positive dengan tingkat signifikansi yang dikoreksi mengingat bahwa kedua hipotesis itu salah (yaitu ) diberikan oleh karena semua nilai dan lebih rendah dari mengingat bahwa danθ=α2αα2Hi=0

P((p1α2)(p2α2)|H1=0,H2=0)=1
p1p2α2H1=0H2=0oleh konstruksi. Koreksi Bonferroni, bagaimanapun, akan mengklaim bahwa FWER kurang dari .α
Fabee
sumber
Pertanyaan yang sangat bagus Saya berharap seseorang akan menjawab
1
Kebalikan dari konservatif adalah antikonservatif dalam dunia statistik!
AdamO
Tidak tahu itu. Saya pikir saya membaca liberal beberapa kali.
Fabee
Terima kasih, tapi itu tentang sesuatu yang berbeda. Anda memerlukan asumsi tambahan (ketergantungan bukan masalah, lihat jawaban saya di bawah).
Fabee

Jawaban:

3

Bonferroni tidak bisa liberal, terlepas dari ketergantungan, jika nilai-p Anda dihitung dengan benar.

Biarkan A menjadi peristiwa kesalahan Tipe I dalam satu tes dan biarkan B menjadi acara kesalahan Tipe I dalam tes lain. Probabilitas bahwa A atau B (atau keduanya) akan terjadi adalah:

P (A atau B) = P (A) + P (B) - P (A dan B)

Karena P (A dan B) adalah probabilitas dan dengan demikian tidak boleh negatif, tidak ada cara yang mungkin untuk persamaan itu untuk menghasilkan nilai yang lebih tinggi dari P (A) + P (B). Nilai tertinggi yang dapat dihasilkan oleh persamaan adalah ketika P (A dan B) = 0, yaitu ketika A dan B sangat tergantung negatif. Dalam hal ini, Anda dapat mengisi persamaan sebagai berikut, dengan asumsi nulls benar dan tingkat alfa Bonferroni yang disesuaikan dari 0,025:

P (A atau B) = P (A) + P (B) - P (A dan B) = .025 + .025 - 0 = .05

Di bawah struktur ketergantungan lainnya, P (A dan B)> 0, sehingga persamaan menghasilkan nilai yang bahkan lebih kecil dari 0,05. Misalnya, di bawah ketergantungan positif sempurna, P (A dan B) = P (A), dalam hal ini Anda dapat mengisi persamaan sebagai berikut:

P (A atau B) = P (A) + P (B) - P (A dan B) = .025 + .025 - .025 = .025

Contoh lain: di bawah independensi, P (A dan B) = P (A) P (B). Karenanya:

P (A atau B) = P (A) + P (B) - P (A dan B) = .025 + .025 - .025 * .025 = .0494

Seperti yang Anda lihat, jika satu peristiwa memiliki probabilitas 0,025 dan acara lain juga memiliki probabilitas 0,025, tidak mungkin untuk probabilitas "satu atau keduanya" peristiwa lebih besar dari 0,05, karena tidak mungkin untuk P ( A atau B) lebih besar dari P (A) + P (B). Setiap klaim yang bertentangan secara logis tidak masuk akal.

"Tapi itu dengan asumsi kedua nol itu benar," Anda mungkin berkata. "Bagaimana jika nol pertama benar dan yang kedua salah?" Dalam hal itu, B tidak mungkin karena Anda tidak dapat memiliki kesalahan Tipe I di mana hipotesis nol salah. Jadi, P (B) = 0 dan P (A dan B) = 0. Jadi mari kita isi rumus umum untuk FWER dari dua tes:

P (A atau B) = P (A) + P (B) - P (A dan B) = .025 + 0 - 0 = .025

Jadi sekali lagi FWER adalah <0,05. Perhatikan bahwa ketergantungan tidak relevan di sini karena P (A dan B) selalu 0. Skenario lain yang mungkin adalah bahwa kedua nol adalah salah, tetapi harus jelas bahwa FWER akan menjadi 0, dan dengan demikian <0,05.

Bonferroni
sumber
Terima kasih atas jawabannya. Saya membaca derivasi seperti milik Anda berkali-kali dan itu masuk akal. Namun, saya masih tidak melihat kesalahan dalam contoh saya. Jika tidak masuk akal, di mana kesalahan saya? Saya merasa bahwa masalahnya adalah Anda mengambil menjadi , tetapi untuk FWER Anda sebenarnya tertarik pada . Anda masih dapat memiliki tetapi . Inilah yang saya buat dalam contoh saya. Contoh Anda benar jika kesalahan tipe I tidak tergantung pada hipotesis lainnya. P(A)P(A|H01=True)P(AB|H0(1)=TrueH0(2)=True)P(A|H0(1)=True)=αP(A|H0(1)=TrueH0(2)=True)>α
Fabee
Menghitung FWER mengasumsikan kedua nol itu benar, sehingga P (A) berarti hal yang sama dengan P (A | null 1 benar) dan P (B) berarti hal yang sama dengan P (B | nol 2 benar). Probabilitas kondisional karenanya tidak perlu. Mungkin Anda harus menulis ulang contoh Anda tanpa mereka. Perhatikan bahwa jika "semua nilai p1 dan p2 lebih rendah dari α / 2 mengingat bahwa H1 = 0 dan H2 = 0 oleh konstruksi," maka Anda cukup membuat skenario di mana nilai-p tidak dihitung dengan benar. Jika masing-masing p diuji pada α / 2, masing-masing p harus memiliki peluang α / 2 signifikansi menurut definisi, namun Anda rupanya telah memberikan masing-masing p 100% peluang signifikansi.
Bonferroni
Saya pikir Anda tidak benar. Jika tingkat kesalahan FWER menganggap kedua nol adalah benar, maka saya ingin menghitung P (A atau B | null 1 dan 2 benar). Karena itu dekomposisi yang Anda tulis dalam jawaban Anda memerlukan kondisi yang sama di sisi kanan. Hanya ketika menggunakan probabilitas bersyarat ini menjadi jelas. Nilai-p saya dihitung dengan benar karena P (A | null 1 benar) masih sebagaimana mestinya. Tetapi perhatikan bahwa P (A | null 1 benar) umumnya tidak sama dengan P (A | null 1 dan null 2 ​​benar). α
Fabee
1
Gambarlah sebuah persegi besar di selembar kertas yang mewakili ruang sampel total dari hasil yang mungkin. Kemudian gambar sebuah lingkaran yang mengambil 2,5% dari luas kotak dan beri label A. Kemudian gambar lingkaran lain yang mengambil 2,5% dari luas kotak dan beri label B. Buat A dan B tumpang tindih sedikit atau sebanyak seperti yang Anda inginkan (yaitu bermain dengan ketergantungan antara A dan B). Anda tidak akan menemukan cara untuk menggabungkan area A dan B menjadi lebih dari 2,5% + 2,5% = 5%.
Bonferroni
1
Tampaknya Anda bingung tentang probabilitas pada tingkat yang sangat mendasar dan belum siap untuk mengerjakan matematika. Kami menganggap kedua nol itu benar karena itulah situasi yang menghasilkan FWER maksimum. Jika kedua nol itu salah, jelas tidak mungkin ada kesalahan Tipe I sama sekali. Dan jika satu nol benar dan satu nol salah, tingkat kesalahan hanyalah tingkat alfa apa pun yang Anda gunakan untuk menguji yang benar.
Bonferroni
0

Saya pikir saya akhirnya punya jawabannya. Saya memerlukan persyaratan tambahan pada distribusi . Sebelumnya, saya hanya mensyaratkan bahwa seragam antara 0 dan 1. Dalam hal ini contoh saya benar dan Bonferroni akan terlalu liberal. Namun, jika saya juga memerlukan keseragaman maka mudah diperoleh bahwa Bonferroni tidak pernah bisa terlalu konservatif. Teladan saya melanggar asumsi ini. Dalam istilah yang lebih umum, asumsinya adalah bahwa distribusi semua nilai-p yang diberikan bahwa semua hipotesis nol benar harus memiliki bentuk kopula : Bersama-sama mereka tidak perlu seragam, tetapi sedikit mereka melakukannya.P(p1,p2|H1=0,H2=0)P(p1|H1=0)P(p1|H1=0,H2=0)

Komentar: Jika ada yang bisa mengarahkan saya ke sumber di mana asumsi ini dinyatakan dengan jelas (buku teks, kertas), saya akan menerima jawaban ini.

Fabee
sumber