Banyak perbandingan dengan banyak grup

8

Saya ingin menentukan apakah menggunakan beberapa uji perbandingan akan sesuai untuk data saya. Saya menggunakan tes Kruskal-Wallis untuk menentukan apakah ada perbedaan penghambatan rata-rata di antara17kelompok yang berbeda. Analisis mengungkapkan bahwa ada perbedaan yang signifikan dan sekarang saya ingin menggunakan beberapa prosedur perbandingan (mungkin Dunn karena saya memiliki ukuran sampel yang tidak sama) untuk melihat kelompok mana yang berbeda dari yang lain.

Saya bertanya-tanya karena saya punya banyak kelompok (k=17) apakah ini akan membuat tes perbandingan multipel memiliki kekuatan yang sangat kecil atau tidak sesuai untuk melakukan set data ini?

Mat
sumber
+1 hingga @Alexis menjawab, tetapi Anda harus benar-benar bertanya pada diri sendiri apakah Anda benar - benar perlu menguji semua kombinasi berpasangan dari 17 grup. Apa yang akan Anda lakukan dengan 136 perbandingan ?? Daftar semuanya di kertas?
amoeba
@amoeba memunculkan poin bagus tentang komunikasi. Saya pikir 17 kelompok berada di dekat batas hasil yang dapat dikomunikasikan. Yang mengatakan, lihat perangkat lunak saya yang dikutip: ia memiliki dua format output yang mengatur tabling dari hasil yang persis seperti ini.
Alexis

Jawaban:

9

Pertanyaan bagus! Mari kita jelaskan beberapa kebingungan potensial, pertama. Dunn uji (Dunn, 1964) justru bahwa: statistik uji yang merupakan analog nonparametrik dengan berpasangan t satu tes akan melakukan post hoc ke ANOVA. Hal ini mirip dengan tes penjumlahan peringkat Mann-Whitney-Wilcoxon, kecuali bahwa (1) menggunakan ukuran varian gabungan yang tersirat oleh hipotesis nol dari uji Kruskal-Wallis, dan (2) menggunakan peringkat yang sama dari data asli seseorang seperti yang digunakan oleh tes Kruskal-Wallis.

Dunn juga mengembangkan apa yang biasa disebut sebagai penyesuaian Bonferroni untuk beberapa perbandingan (Dunn, 1961), yang merupakan salah satu dari banyak metode untuk mengendalikan tingkat kesalahan keluarga-bijaksana (FWER) yang sejak itu telah dikembangkan, dan hanya memerlukan pembagianα (tes satu sisi) atau α/2(uji dua sisi) dengan jumlah perbandingan berpasangan yang dibuat seseorang. Jumlah maksimum perbandingan berpasangan yang dapat dilakukan dengan seseorangk variabel adalah k(k-1)/2, jadi itu 17 * 16/2 = 136 kemungkinan perbandingan berpasangan, menyiratkan bahwa Anda mungkin dapat menolak hipotesis nol untuk setiap tes tunggal jika halα/2/136. Karena itu kekhawatiran Anda tentang kekuasaan dijamin untuk metode ini.

Namun, metode lain untuk mengendalikan FWER ada dengan kekuatan statistik yang lebih besar. Misalnya, metode bertahap Holm dan Holm-Sidak (Holm, 1979) tidak mengalami pendarahan seperti cara metode Bonferroni. Ada juga, Anda bisa bertujuan untuk mengendalikan tingkat penemuan palsu (FDR) bukan, dan metode ini-Benjamini-Hochberg (1995), dan Benjamini-Yekutieli (2001)-umumnya memberikan lebih banyak kekuatan statistik dengan asumsi bahwa beberapa hipotesis nol adalah palsu (Yaitu dengan membangun gagasan bahwa tidak semua penolakan adalah penolakan palsu ke dalam kriteria penolakan yang dimodifikasi secara berurutan). Ini dan beberapa penyesuaian perbandingan lainnya diterapkan secara khusus untuk pengujian Dunn di Stata dalam paket dunntest (dalam tipe Statanet describe dunntest, from(https://alexisdinno.com/stata)), dan dalam R dalam paket dunn.test .

Selain itu, ada alternatif untuk uji Dunn (yang didasarkan pada perkiraan statistik uji z ): Conover-Iman (eksklusif) post hoc ke tes Kruskal-Wallis yang ditolak (yang didasarkan pada distribusi t , dan yang merupakan lebih kuat dari tes Dunn; Conover & Iman, 1979; Convover, 1999). Seseorang juga dapat menggunakan metode untuk mengontrol FWER atau FDR dengan tes Conover-Iman, yang diimplementasikan untuk Stata dalam paket conovertest (dalam tipe Stata net describe conovertest, from(https://alexisdinno.com/stata)), dan untuk R dalam paket conover.test .

Referensi

Benjamini, Y. dan Hochberg, Y. (1995). Mengontrol Tingkat Penemuan Salah: Pendekatan Praktis dan Kuat untuk Pengujian Berganda . Jurnal Masyarakat Statistik Kerajaan . Seri B (Metodologi), 57 (1): 289–300.

Benjamini, Y. dan Yekutieli, D. (2001). Kontrol tingkat penemuan palsu dalam beberapa pengujian di bawah ketergantungan . Annals of Statistics , 29 (4): 1165–1188.

Conover, WJ (1999). Statistik Nonparametrik Praktis . Wiley, Hoboken, NJ, edisi ke-3.

Conover, WJ dan Iman, RL (1979). Pada beberapa prosedur perbandingan . Laporan Teknis LA-7677-MS, Laboratorium Ilmiah Los Alamos.

Dunn, OJ (1961). Beberapa perbandingan antar cara . Jurnal Asosiasi Statistik Amerika , 56 (293): 52–64.

Dunn, OJ (1964). Beberapa perbandingan menggunakan jumlah peringkat . Technometrics , 6 (3): 241–252.

Holm, S. (1979). Prosedur tes beberapa kali menolak sederhana berurutan . Scandinavian Journal of Statistics , 6 (65-70): 1979.

Alexis
sumber