Saya ingin menentukan apakah menggunakan beberapa uji perbandingan akan sesuai untuk data saya. Saya menggunakan tes Kruskal-Wallis untuk menentukan apakah ada perbedaan penghambatan rata-rata di antarakelompok yang berbeda. Analisis mengungkapkan bahwa ada perbedaan yang signifikan dan sekarang saya ingin menggunakan beberapa prosedur perbandingan (mungkin Dunn karena saya memiliki ukuran sampel yang tidak sama) untuk melihat kelompok mana yang berbeda dari yang lain.
Saya bertanya-tanya karena saya punya banyak kelompok () apakah ini akan membuat tes perbandingan multipel memiliki kekuatan yang sangat kecil atau tidak sesuai untuk melakukan set data ini?
Jawaban:
Pertanyaan bagus! Mari kita jelaskan beberapa kebingungan potensial, pertama. Dunn uji (Dunn, 1964) justru bahwa: statistik uji yang merupakan analog nonparametrik dengan berpasangan t satu tes akan melakukan post hoc ke ANOVA. Hal ini mirip dengan tes penjumlahan peringkat Mann-Whitney-Wilcoxon, kecuali bahwa (1) menggunakan ukuran varian gabungan yang tersirat oleh hipotesis nol dari uji Kruskal-Wallis, dan (2) menggunakan peringkat yang sama dari data asli seseorang seperti yang digunakan oleh tes Kruskal-Wallis.
Dunn juga mengembangkan apa yang biasa disebut sebagai penyesuaian Bonferroni untuk beberapa perbandingan (Dunn, 1961), yang merupakan salah satu dari banyak metode untuk mengendalikan tingkat kesalahan keluarga-bijaksana (FWER) yang sejak itu telah dikembangkan, dan hanya memerlukan pembagianα (tes satu sisi) atau α / 2 (uji dua sisi) dengan jumlah perbandingan berpasangan yang dibuat seseorang. Jumlah maksimum perbandingan berpasangan yang dapat dilakukan dengan seseorangk variabel adalah k ( k - 1 ) / 2 , jadi itu 17 * 16/2 = 136 kemungkinan perbandingan berpasangan, menyiratkan bahwa Anda mungkin dapat menolak hipotesis nol untuk setiap tes tunggal jika p ≤ a / 2 / 136 . Karena itu kekhawatiran Anda tentang kekuasaan dijamin untuk metode ini.
Namun, metode lain untuk mengendalikan FWER ada dengan kekuatan statistik yang lebih besar. Misalnya, metode bertahap Holm dan Holm-Sidak (Holm, 1979) tidak mengalami pendarahan seperti cara metode Bonferroni. Ada juga, Anda bisa bertujuan untuk mengendalikan tingkat penemuan palsu (FDR) bukan, dan metode ini-Benjamini-Hochberg (1995), dan Benjamini-Yekutieli (2001)-umumnya memberikan lebih banyak kekuatan statistik dengan asumsi bahwa beberapa hipotesis nol adalah palsu (Yaitu dengan membangun gagasan bahwa tidak semua penolakan adalah penolakan palsu ke dalam kriteria penolakan yang dimodifikasi secara berurutan). Ini dan beberapa penyesuaian perbandingan lainnya diterapkan secara khusus untuk pengujian Dunn di Stata dalam paket dunntest (dalam tipe Stata
net describe dunntest, from(https://alexisdinno.com/stata)
), dan dalam R dalam paket dunn.test .Selain itu, ada alternatif untuk uji Dunn (yang didasarkan pada perkiraan statistik uji z ): Conover-Iman (eksklusif) post hoc ke tes Kruskal-Wallis yang ditolak (yang didasarkan pada distribusi t , dan yang merupakan lebih kuat dari tes Dunn; Conover & Iman, 1979; Convover, 1999). Seseorang juga dapat menggunakan metode untuk mengontrol FWER atau FDR dengan tes Conover-Iman, yang diimplementasikan untuk Stata dalam paket conovertest (dalam tipe Stata
net describe conovertest, from(https://alexisdinno.com/stata)
), dan untuk R dalam paket conover.test .Referensi
Benjamini, Y. dan Hochberg, Y. (1995). Mengontrol Tingkat Penemuan Salah: Pendekatan Praktis dan Kuat untuk Pengujian Berganda . Jurnal Masyarakat Statistik Kerajaan . Seri B (Metodologi), 57 (1): 289–300.
Benjamini, Y. dan Yekutieli, D. (2001). Kontrol tingkat penemuan palsu dalam beberapa pengujian di bawah ketergantungan . Annals of Statistics , 29 (4): 1165–1188.
Conover, WJ (1999). Statistik Nonparametrik Praktis . Wiley, Hoboken, NJ, edisi ke-3.
Conover, WJ dan Iman, RL (1979). Pada beberapa prosedur perbandingan . Laporan Teknis LA-7677-MS, Laboratorium Ilmiah Los Alamos.
Dunn, OJ (1961). Beberapa perbandingan antar cara . Jurnal Asosiasi Statistik Amerika , 56 (293): 52–64.
Dunn, OJ (1964). Beberapa perbandingan menggunakan jumlah peringkat . Technometrics , 6 (3): 241–252.
Holm, S. (1979). Prosedur tes beberapa kali menolak sederhana berurutan . Scandinavian Journal of Statistics , 6 (65-70): 1979.
sumber