Dalam literatur tingkat kesalahan keluarga (FWER) dan false discovery rate (FDR), metode tertentu untuk mengendalikan FWER atau FDR dikatakan sesuai untuk tes dependen atau independen. Sebagai contoh, dalam makalah 1979 "Prosedur Tes Multi Tolak Berurutan Sederhana", Holm menulis untuk membandingkan langkah-langkahnya Šidák metode versus langkah-langkahnya metode kontrol Bonferroni:
Kesederhanaan komputasi yang sama diperoleh ketika statistik uji independen .
Dalam "Mengontrol Tingkat Penemuan Salah" oleh Benjamini dan Hochberg (1995), penulis menulis:
Teorema 1. Untuk statistik uji independen dan untuk setiap konfigurasi hipotesis nol palsu, prosedur di atas mengontrol FDR pada .
Kemudian, pada tahun 2001, Benjamini dan Yekutieli menulis:
1.3. Masalah . Ketika mencoba menggunakan pendekatan FDR dalam praktiknya, statistik uji dependen lebih sering dijumpai daripada yang independen , contoh titik akhir berganda di atas menjadi titik kasus.
Arti tertentu dari dependen dan independen yang digunakan penulis ini? Saya akan senang untuk definisi formal tentang apa yang membuat tes tergantung atau independen satu sama lain jika mereka disertai penjelasan bahasa yang sederhana.
Saya dapat memikirkan beberapa kemungkinan arti yang berbeda, tetapi saya tidak begitu mengerti yang, jika ada, mereka mungkin:
"Dependent" berarti tes multivarian (yaitu banyak variabel dependen dengan prediktor yang sama atau serupa); independen berarti tes univariat (yaitu banyak variabel independen, satu variabel dependen).
"Tergantung" berarti tes berdasarkan pada subjek berpasangan / cocok (mis. Uji t berpasangan , tindakan berulang ANOVA, dll.); "Independen" berarti desain studi sampel yang tidak berpasangan / independen.
"Dependent" berarti probabilitas bahwa suatu tes ditolak berkorelasi dengan probabilitas bahwa tes lain ditolak, dan "ketergantungan positif" berarti bahwa korelasi ini positif; "Independen" berarti probabilitas penolakan tidak berkorelasi.
Referensi
Benjamini, Y. dan Hochberg, Y. (1995). Mengontrol Tingkat Penemuan Salah: Pendekatan Praktis dan Kuat untuk Pengujian Berganda . Jurnal Masyarakat Statistik Kerajaan. Seri B (Metodologi) , 57 (1): 289–300.
Benjamini, Y. dan Yekutieli, D. (2001). Kontrol tingkat penemuan palsu dalam beberapa pengujian di bawah ketergantungan . Annals of Statistics , 29 (4): 1165-1188.
Holm, S. (1979). Prosedur tes beberapa kali menolak sederhana berurutan . Scandinavian Journal of Statistics , 6 (65-70): 1979.
sumber
Jawaban:
"Beberapa perbandingan" adalah nama yang dilampirkan pada masalah umum pengambilan keputusan berdasarkan hasil lebih dari satu tes. Sifat masalah diperjelas oleh kartun XKCD "Green jelly bean" yang terkenal di mana para peneliti melakukan uji hipotesis hubungan antara konsumsi kacang jelly (dari 20 warna berbeda) dan jerawat. Satu tes melaporkan p-value kurang dari , yang mengarah ke kesimpulan bahwa "hijau jelly kacang penyebab jerawat." Lelucon adalah bahwa p-nilai, dengan desain, memiliki 1 / 201 / 20 1 / 20 1 / 20 20 tes yang berbeda.
(ANOVA menangani masalah ini melalui uji-F keseluruhannya. Ini semacam perbandingan "untuk mengatur semuanya": kami tidak akan mempercayai perbandingan kelompok-ke-kelompok kecuali pertama-tama uji-F ini signifikan.)
Distribusi gabungan variabel acak independen mudah dihitung. Karena itu literatur membedakan antara situasi ini dan kasus non-kemerdekaan.
Dengan demikian, arti yang benar dari "independen" dalam kutipan adalah dalam arti statistik biasa dari variabel acak independen.
sumber