Dapatkah tes Mann-Whitney digunakan untuk perbandingan post-hoc setelah Kruskal-Wallis?

9

Saya memiliki simulasi di mana seekor hewan ditempatkan di lingkungan yang bermusuhan dan diatur waktunya untuk melihat berapa lama ia dapat bertahan hidup menggunakan beberapa pendekatan untuk bertahan hidup. Ada tiga pendekatan yang bisa digunakan untuk bertahan hidup. Saya menjalankan 300 simulasi hewan menggunakan setiap pendekatan bertahan hidup. Semua simulasi terjadi di lingkungan yang sama tetapi ada beberapa keacakan sehingga berbeda setiap kali. Saya menghitung berapa detik binatang itu bertahan dalam setiap simulasi. Hidup lebih lama lebih baik. Data saya terlihat seperti ini:

Approach 1, Approach 2, Approach 2
45,79,38
48,32,24
85,108,44
... 300 rows of these

Saya tidak yakin dengan semua yang saya lakukan setelah titik ini, jadi beri tahu saya jika saya melakukan sesuatu yang bodoh dan salah. Saya mencoba mencari tahu apakah ada perbedaan statistik pada umur menggunakan pendekatan tertentu.

Saya menjalankan tes Shapiro pada masing-masing sampel dan mereka kembali dengan nilai p kecil, jadi saya percaya data tidak dinormalisasi.

Data pada baris tidak memiliki hubungan satu sama lain. Benih acak yang digunakan untuk setiap simulasi berbeda. Akibatnya, saya percaya data tidak dipasangkan.

Karena data tidak dinormalisasi, tidak dipasangkan dan ada lebih dari dua sampel, saya menjalankan tes Kruskal Wallis yang kembali dengan nilai p 0,048. Saya kemudian pindah ke post hoc, memilih Mann Whitney. Benar-benar tidak yakin apakah Mann Whitney harus digunakan di sini.

Saya membandingkan masing-masing pendekatan survival dengan satu sama lain pendekatan dengan melakukan tes Mann Whitney yaitu {(pendekatan 1, pendekatan 2), (pendekatan 1, pendekatan 3), (pendekatan 2, pendekatan 3)}. Tidak ada temuan signifikansi statistik antara pasangan (pendekatan 2, pendekatan 3) menggunakan uji dua sisi tetapi ada perbedaan signifikansi yang ditemukan menggunakan uji satu sisi.

Masalah:

  1. Saya tidak tahu apakah menggunakan Mann Whitney seperti ini masuk akal.
  2. Saya tidak tahu apakah saya harus menggunakan Mann Whitney satu atau dua ekor.
Phlox Midas
sumber
Apakah Anda memiliki hipotesis apriori tentang kekuatan relatif dari pendekatan yang berbeda (misalnya pendekatan1> pendekatan2> pendekatan3)? Ini penting untuk menjawab pertanyaan Anda.
amoeba
Saya memiliki mean, median dan standar deviasi dan tampaknya pendekatan 3 lebih baik karena memiliki median yang lebih tinggi dan rata-rata tetapi juga memiliki standar deviasi yang jauh lebih tinggi sehingga saya tidak yakin. Tapi saya tidak punya cara untuk mengetahui ini sebelumnya.
Phlox Midas
Atau apakah itu juga dikenal sebagai koreksi Bonferroni?
Phlox Midas
Phlox: jika "tidak ada cara untuk mengetahui hal ini sebelumnya", Anda harus benar-benar tidak menggunakan tes satu sisi, hanya dua sisi (seperti @Alexis disebutkan dalam jawabannya juga).
amoeba
6
@amoeba "nya";)
Alexis

Jawaban:

15

U

Berikut ini alasannya: Tes Dunn adalah tepat post hoc tes * menyusul penolakan dari uji Kruskal-Wallis. Jika seseorang melanjutkan dengan bergerak dari penolakan Kruskal-Wallis ke melakukan tes peringkat pasangan-bijaksana biasa (yaitu Wilcoxon atau Mann-Whitney) tes, maka dua masalah memperoleh: (1) peringkat yang digunakan untuk tes jumlah peringkat pasangan-bijaksana adalah bukan peringkat yang digunakan oleh tes Kruskal-Wallis; dan (2) tes peringkat jumlah tidak menggunakan varian gabungan yang disiratkan oleh hipotesis nol Kruskal-Wallis. Tes Dunn tidak memiliki masalah ini

α

Kecuali jika Anda memiliki alasan untuk meyakini bahwa waktu bertahan hidup satu kelompok lebih panjang atau lebih pendek daripada apriori yang lain , Anda harus menggunakan tes dua sisi.

Tes Dunn dapat dilakukan di Stata menggunakan dunntest (tipe net describe dunntest, from(https://www.alexisdinno.com/stata)), dan di R menggunakan paket dunn.test .

Juga, saya bertanya-tanya apakah Anda mungkin mengambil pendekatan analisis kelangsungan hidup untuk menilai apakah dan kapan seekor hewan mati berdasarkan kondisi yang berbeda?


* Beberapa tes paska-hoc yang kurang terkenal untuk mengikuti Kruskal-Wallis yang ditolak, termasuk Conover-Iman (seperti Dunn, tetapi berdasarkan distribusi t , daripada distribusi z , diterapkan untuk Stata dalam paket conovertest , dan untuk R dalam paket conover.test ), dan tes Dwass-Steel-Citchlow-Fligner.

Alexis
sumber
Terima kasih atas jawaban anda. Apakah tes Dunn juga dikenal sebagai tes Nemenyi-Damico-Wolfe-Dunn atau itu tes terpisah?
Phlox Midas
Saya bertanya karena saya tidak dapat menemukan implementasi tes Dunn.
Phlox Midas
@ PhloxMidas Saya tidak tahu tentang "tes Nemenyi-Damico-Wolfe-Dunn," tetapi Wikipedia menyiratkan itu adalah tes post hoc yang tepat setelah penolakan tes omnibus dalam desain tindakan berulang-ulang — misalnya mengikuti tes Friedman. Juga, lihat komentar saya tentang Stata.
Alexis
7

Generalisasi pemersatu Kruskal-Wallis / Wilcoxon adalah model odds proporsional, yang mengakui kontras umum dengan interval kepercayaan baik secara pointwise atau simultan untuk odds ratio. Ini diimplementasikan dalam rmspaket R saya ormdan contrast.rmsfungsi.

Frank Harrell
sumber
1

Anda juga dapat menggunakan perbedaan kritis setelah Conover atau perbedaan kritis setelah Schaich dan Hamerle. Yang pertama lebih liberal sedangkan yang kedua tepat tetapi tidak memiliki sedikit kekuatan. Kedua metode diilustrasikan di situs web saya brightstat.com dan webapp brightstat juga memungkinkan Anda menghitung perbedaan kritis ini dan langsung melakukan tes post-hoc. Kruskal-Wallis di brightstat.com

Daniel Stricker
sumber
-1

Jika Anda menggunakan SPSS, lakukan post-hoc Mann-Whitney dengan koreksi Bonferroni (nilai p dibagi dengan jumlah kelompok).

Caramba
sumber
Mann-Whitney menderita dua masalah yang saya identifikasi dalam jawaban saya, dan merupakan tes post hoc yang tidak sesuai untuk Kruskal-Wallis.
Alexis