Mengapa mengontrol FDR lebih ketat daripada mengendalikan FWER?

16

Saya telah membaca bahwa mengendalikan FDR tidak seketat mengendalikan FWER, seperti di Wikipedia :

Prosedur pengendalian FDR memberikan kontrol yang kurang ketat terhadap penemuan palsu dibandingkan dengan prosedur tingkat kesalahan keluarga (FWER) (seperti koreksi Bonferroni). Ini meningkatkan daya dengan biaya meningkatkan tingkat kesalahan tipe I, yaitu, menolak hipotesis nol yang tidak berpengaruh ketika harus diterima.

Tapi saya bertanya-tanya bagaimana hal itu terbukti benar secara matematis?

Apakah ada hubungan antara FDR dan FWER?

StackExchange untuk Semua
sumber
4
Apakah Anda membaca kertas aslinya? Ini adalah segalanya yang bisa diharapkan seseorang dalam sebuah makalah statistik: Sebuah gagasan fundamental tunggal, sebuah kisah yang jelas dan ringkas untuk diceritakan, sebuah contoh yang berguna, dan bukti (pendek!) Yang akurat.
kardinal

Jawaban:

10

Memang, @ cardinal benar bahwa kertasnya sejelas yang didapatnya. Jadi, untuk apa nilainya, jika Anda tidak memiliki akses ke kertas, berikut adalah versi yang agak rumit tentang bagaimana Benjamini – Hochberg berpendapat:

FDR adalah nilai yang diharapkan dari proporsi penolakan palsu v untuk semua penolakan r . Sekarang, r jelas merupakan jumlah dari penolakan yang salah dan benar; memanggil kedua s .Qevrrs

Singkatnya, (menggunakan huruf kapital untuk variabel acak dan huruf kecil untuk nilai realisasi),

Qe=E(VR)=E(VV+S)=:E(Q).

Seseorang mengambil jika R = 0 .Q=0R=0

Sekarang, ada dua kemungkinan: apakah semua nol benar atau hanya m 0 < m dari semuanya benar. Dalam kasus pertama, tidak mungkin ada penolakan yang benar, jadi r = v . Jadi, jika ada penolakan ( r 1 ), q = 1 , jika tidak q = 0 . Karenanya,mm0<mr=vr1q=1q=0

FDR=E(Q)=1P(Q=1)+0P(Q=0)=P(Q=1)=P(V1)=FWER

Jadi, dalam kasus ini, sedemikian rupa sehingga setiap prosedur yang mengontrol F D R sepele juga mengontrol F W E R dan sebaliknya.FDR=FWERFDRFWER

Dalam kasus kedua di mana , jika v > 0 (jadi jika ada setidaknya satu penolakan salah), kita jelas memiliki (ini menjadi fraksi dengan juga v dalam penyebut) yang v / r 1 . Ini berarti bahwa fungsi indikator yang mengambil nilai 1 jika ada setidaknya satu penolakan palsu, 1 V 1 tidak akan kurang dari Q , 1 V 1Q . Sekarang, ambil ekspektasi di kedua sisi ketidaksetaraan, yang oleh monotonitas Em0<mv>0vv/r11V1Q1V1QE meninggalkan ketidaksetaraan utuh,

E(1V1)E(Q)=FDR

Nilai yang diharapkan dari fungsi indikator menjadi probabilitas dari peristiwa dalam indikator, kita memiliki , yang lagi-lagi adalah F W E R .E(1V1)=P(V1)FWER

Jadi, ketika kita memiliki prosedur yang mengontrol dalam arti bahwa F W E Rα , kita harus memiliki F D Rα .FWERFWERαFDRα

Sebaliknya, memiliki kontrol pada beberapa α dapat datang dengan F W E R yang jauh lebih besar . Secara intuitif, menerima fraksi yang diharapkan bukan nol dari penolakan palsu ( F D R ) dari total potensi hipotesis yang diuji dapat menyiratkan probabilitas yang sangat tinggi dari setidaknya satu penolakan palsu ( F W E R ).FDRαFWERFDRFWER

Jadi, suatu prosedur harus kurang ketat ketika hanya kontrol yang diinginkan, yang juga baik untuk daya. Ini adalah ide yang sama seperti dalam tes hipotesis dasar: ketika Anda menguji pada tingkat 5% Anda menolak lebih sering (baik nol benar dan salah) daripada ketika menguji pada tingkat 1% hanya karena Anda memiliki nilai kritis yang lebih kecil.FDR

Christoph Hanck
sumber
2
(+1) Eksposisi yang bagus. Jelas, dalam kasus pertama kita juga bisa mengatakan kontrol FWER menyiratkan kontrol FDR (yang merupakan masalah yang dipermasalahkan). Juga, mungkin perlu menunjukkan bahwa properti ini datang tanpa asumsi distribusi (misalnya, independensi) pada statistik uji, tidak seperti prosedur yang diberikan dalam makalah asli untuk mengendalikan FDR.
kardinal