Arti bahasa polos dari tes "tergantung" dan "independen" dalam berbagai literatur perbandingan?

18

Dalam literatur tingkat kesalahan keluarga (FWER) dan false discovery rate (FDR), metode tertentu untuk mengendalikan FWER atau FDR dikatakan sesuai untuk tes dependen atau independen. Sebagai contoh, dalam makalah 1979 "Prosedur Tes Multi Tolak Berurutan Sederhana", Holm menulis untuk membandingkan langkah-langkahnya Šidák metode versus langkah-langkahnya metode kontrol Bonferroni:

Kesederhanaan komputasi yang sama diperoleh ketika statistik uji independen .

Dalam "Mengontrol Tingkat Penemuan Salah" oleh Benjamini dan Hochberg (1995), penulis menulis:

Teorema 1. Untuk statistik uji independen dan untuk setiap konfigurasi hipotesis nol palsu, prosedur di atas mengontrol FDR pada .q

Kemudian, pada tahun 2001, Benjamini dan Yekutieli menulis:

1.3. Masalah . Ketika mencoba menggunakan pendekatan FDR dalam praktiknya, statistik uji dependen lebih sering dijumpai daripada yang independen , contoh titik akhir berganda di atas menjadi titik kasus.

Arti tertentu dari dependen dan independen yang digunakan penulis ini? Saya akan senang untuk definisi formal tentang apa yang membuat tes tergantung atau independen satu sama lain jika mereka disertai penjelasan bahasa yang sederhana.

Saya dapat memikirkan beberapa kemungkinan arti yang berbeda, tetapi saya tidak begitu mengerti yang, jika ada, mereka mungkin:

  • "Dependent" berarti tes multivarian (yaitu banyak variabel dependen dengan prediktor yang sama atau serupa); independen berarti tes univariat (yaitu banyak variabel independen, satu variabel dependen).

  • "Tergantung" berarti tes berdasarkan pada subjek berpasangan / cocok (mis. Uji t berpasangan , tindakan berulang ANOVA, dll.); "Independen" berarti desain studi sampel yang tidak berpasangan / independen.

  • "Dependent" berarti probabilitas bahwa suatu tes ditolak berkorelasi dengan probabilitas bahwa tes lain ditolak, dan "ketergantungan positif" berarti bahwa korelasi ini positif; "Independen" berarti probabilitas penolakan tidak berkorelasi.

Referensi
Benjamini, Y. dan Hochberg, Y. (1995). Mengontrol Tingkat Penemuan Salah: Pendekatan Praktis dan Kuat untuk Pengujian Berganda . Jurnal Masyarakat Statistik Kerajaan. Seri B (Metodologi) , 57 (1): 289–300.

Benjamini, Y. dan Yekutieli, D. (2001). Kontrol tingkat penemuan palsu dalam beberapa pengujian di bawah ketergantungan . Annals of Statistics , 29 (4): 1165-1188.

Holm, S. (1979). Prosedur tes beberapa kali menolak sederhana berurutan . Scandinavian Journal of Statistics , 6 (65-70): 1979.

Alexis
sumber
1
Statistik uji adalah variabel acak. "Independen" dalam konteks ini memiliki makna yang persis sama dengan variabel acak apa pun.
whuber
Terima kasih @whuber setiap kesempatan yang ingin Anda perkuat menjadi jawaban? :)
Alexis

Jawaban:

13

"Beberapa perbandingan" adalah nama yang dilampirkan pada masalah umum pengambilan keputusan berdasarkan hasil lebih dari satu tes. Sifat masalah diperjelas oleh kartun XKCD "Green jelly bean" yang terkenal di mana para peneliti melakukan uji hipotesis hubungan antara konsumsi kacang jelly (dari 20 warna berbeda) dan jerawat. Satu tes melaporkan p-value kurang dari , yang mengarah ke kesimpulan bahwa "hijau jelly kacang penyebab jerawat." Lelucon adalah bahwa p-nilai, dengan desain, memiliki 1 / 201/201/201/2020 tes yang berbeda.

20

201/2020(10.05)200.3610.36=0.64

2020 hasil secara statistik independen. Tapi mengapa tidak? Analisis Varians memberikan contoh standar: ketika membandingkan dua atau lebih kelompok perlakuan terhadap kelompok kontrol, setiap perbandingan melibatkan hasil kontrol yang sama . Perbandingannya tidak independen. Sekarang, misalnya, perbedaan "signifikan" dapat muncul karena variasi kesempatan dalam kontrol. Variasi seperti itu dapat secara bersamaan mengubah perbandingan dengan setiap kelompok.

(ANOVA menangani masalah ini melalui uji-F keseluruhannya. Ini semacam perbandingan "untuk mengatur semuanya": kami tidak akan mempercayai perbandingan kelompok-ke-kelompok kecuali pertama-tama uji-F ini signifikan.)

(p1,p2,,pn)nndari mereka menjadi satu keputusan. Kalau tidak, yang terbaik yang biasanya bisa kita lakukan adalah mengandalkan perkiraan batas (yang merupakan dasar dari koreksi Bonferroni, misalnya).

Distribusi gabungan variabel acak independen mudah dihitung. Karena itu literatur membedakan antara situasi ini dan kasus non-kemerdekaan.

Dengan demikian, arti yang benar dari "independen" dalam kutipan adalah dalam arti statistik biasa dari variabel acak independen.


n(x1,,xm)μμ=0p1μ=1p2(p1,p2)

whuber
sumber
+1 Terima kasih, wah! Untuk contoh ANOVA, apakah itu akan terjadi bahwa setiap perbandingan berpasangan berikut ANOVA mana semua pasangan yang mungkin diuji akan "tergantung", atau hanya kasus di mana satu kelompok dibandingkan terhadap pilihan orang lain? (Saya pikir yang pertama, tetapi ingin memastikan).
Alexis
2
Dalam ANOVA, varian residu diperkirakan dari semua data. Dengan demikian setiap dua perbandingan akan (sedikit) tergantung jika hanya untuk alasan itu, bahkan ketika perbandingan tidak memiliki kelompok yang sama. Ketika perbandingan memiliki kelompok yang sama (seperti "A" vs "C" dan "B" vs "C"), ketergantungannya lebih jelas dan nyata.
whuber