Saya telah melihat melalui banyak literatur yang tersedia online, termasuk forum ini tanpa hasil dan berharap seseorang dapat membantu masalah statistik yang saya hadapi saat ini:
Saya memiliki 5 daftar data peringkat, masing-masing berisi 10 item peringkat dari posisi 1 (terbaik) ke posisi 10 (terburuk). Demi konteks, 10 item dalam setiap daftar adalah sama, tetapi dalam urutan peringkat yang berbeda karena teknik yang digunakan untuk menentukan peringkat mereka berbeda.
Contoh data:
List 1 List 2 List 3 ... etc
Item 1 Ranked 1 Ranked 2 Ranked 1
Item 2 Ranked 3 Ranked 1 Ranked 2
Item 3 Ranked 2 Ranked 3 Ranked 3
... etc
Saya mencari cara untuk menafsirkan dan menganalisis data di atas sehingga saya mendapatkan hasil akhir yang menunjukkan peringkat keseluruhan dari setiap item berdasarkan pada setiap tes dan posisinya, misalnya
Result
Rank 1 = Item 1
Rank 2 = Item 3
Rank 3 = Item 4
... etc
Sejauh ini saya telah berusaha untuk menafsirkan informasi ini dari melakukan Korelasi Pearson, Korelasi Spearman, Kendall Tau B, dan tes Friedman. Namun saya telah menemukan, bahwa hasil ini secara umum memasangkan daftar saya (yaitu membandingkan daftar 1 dengan daftar 2, kemudian daftar 1 ke daftar 3 .. dll), atau telah menghasilkan hasil seperti Chi-Square, P-Values dll tentang keseluruhan data.
Adakah yang tahu bagaimana saya bisa menginterpretasikan data ini dalam metode yang baik secara statistik (pada tingkat pasca sarjana / PhD yang berlaku) sehingga saya bisa memahami peringkat keseluruhan yang menandakan pentingnya setiap item dalam daftar di 5 tes? Atau, jika ada jenis teknik atau uji statistik lain yang bisa saya lihat, saya akan sangat menghargai petunjuk atau petunjuk.
(Mungkin juga perlu dicatat, saya juga telah melakukan teknik matematika yang lebih sederhana seperti penjumlahan, rata-rata, tes minimum-maksimum dll, tetapi tidak merasa ini cukup penting secara statistik pada level ini).
Setiap bantuan atau saran akan sangat dihargai, terima kasih atas waktu Anda.
Jawaban:
Saya tidak yakin mengapa Anda melihat korelasi dan ukuran serupa. Tampaknya tidak ada apa pun untuk dikorelasikan.
Sebaliknya, ada sejumlah opsi, tidak ada yang benar-benar lebih baik daripada yang lain, tetapi tergantung pada apa yang Anda inginkan:
Ambil peringkat rata-rata dan kemudian peringkat rata-rata (tetapi ini memperlakukan data sebagai interval)
Ambil peringkat median dan kemudian rangking median (tetapi ini dapat menghasilkan ikatan)
Ambil jumlah suara tempat pertama yang didapat setiap item, dan beri peringkat berdasarkan ini
Ambil jumlah suara tempat terakhir dan beri peringkat (berbanding terbalik, jelas) berdasarkan itu.
Buat beberapa kombinasi peringkat tertimbang, tergantung pada apa yang menurut Anda masuk akal.
sumber
Seperti yang telah ditunjukkan orang lain, ada banyak opsi yang mungkin Anda kejar. Metode yang saya rekomendasikan didasarkan pada peringkat rata-rata, yaitu proposal pertama Peter.
Dalam hal ini, kepentingan statistik dari peringkat akhir dapat diperiksa dengan uji statistik dua langkah. Ini adalah prosedur non-parametrik yang terdiri dari uji Friedman dengan uji post-hoc yang sesuai, tes Nemenyi . Keduanya berdasarkan peringkat rata-rata. Tujuan dari uji Friedman adalah untuk menolak hipotesis nol dan menyimpulkan bahwa ada yang beberapa perbedaan antara item. Jika demikian, kami melanjutkan dengan tes Nemenyi untuk mengetahui item mana yang sebenarnya berbeda. (Kami tidak langsung memulai dengan tes post-hoc untuk menghindari signifikansi yang ditemukan secara kebetulan.)
Rincian lebih lanjut, seperti nilai kritis untuk kedua tes ini, dapat ditemukan di koran oleh Demsar .
sumber
Gunakan Tau-x (di mana "x" mengacu pada "eXtended" Tau-b). Tau-x adalah ekuivalen korelasi dari metrik jarak Kemeny-Snell - terbukti sebagai metrik jarak unik antara daftar item peringkat yang memenuhi semua persyaratan metrik jarak. Lihat bab 2 dari "Model Matematika dalam Ilmu Sosial" oleh Kemeny dan Snell, juga "Koefisien Korelasi Peringkat Baru dengan Penerapan pada Masalah Peringkat Konsensus, Edward Emond, David Mason, Jurnal Analisis Keputusan Multi-Kriteria, 11: 17- 28 (2002).
sumber