Saya memiliki kumpulan data dari survei pelanggan, saya ingin menggunakan uji statistik untuk melihat apakah ada perbedaan signifikan antara produk 1 dan produk 2.
Berikut ini adalah kumpulan data ulasan pelanggan.
Nilai dari sangat buruk, buruk, oke, bagus, sangat bagus.
customer product1 product2
1 very good very bad
2 good bad
3 okay bad
4 very good okay
5 bad very good
6 okay good
7 bad okay
8 very good very bad
9 good good
10 good very good
11 okay okay
12 very good good
13 good good
14 very good okay
15 very good okay
Metode apa yang harus saya gunakan untuk melihat apakah ada perbedaan antara kedua produk ini?
Jawaban:
Untuk peringkat oleh hakim yang berbeda, seseorang dapat menggunakan tes Friedman. http://en.wikipedia.org/wiki/Friedman_test
Anda dapat mengonversi peringkat dari sangat buruk ke sangat baik ke angka -2, -1, 0, 1 dan 2. Kemudian masukkan data dalam bentuk panjang dan terapkan friedman.test dengan pelanggan sebagai faktor pemblokir:
Peringkat perbedaan antara 2 produk tidak signifikan.
Edit:
Berikut ini adalah output dari regresi:
sumber
Satu kemungkinan adalah Anda bisa menggunakan tes tanda.
Ini bergantung pada perbandingan dalam pelanggan untuk melihat apakah peringkat mereka dari produk1 ke produk2 naik, turun, atau tetap sama (di bawah tes tanda binomial anggapannya adalah Anda hanya mendapatkan hasil "naik" atau "turun", tetapi ada beberapa cara umum untuk mendekati ikatan dalam-pasangan, seperti pelanggan 9's
good
vsgood
).Salah satu pendekatan umum adalah untuk mengecualikan peringkat terikat seperti pelanggan 9 (sehingga kesimpulannya adalah tentang proporsi relatif perbedaan naik-turun dalam populasi, dengan asumsi sampel acak pelanggan).
Dalam hal ini Anda memiliki 4 pelanggan yang memberi peringkat lebih tinggi untuk produk kedua, 8 yang memberi lebih rendah, dan tiga yang memberi yang sama.
Dalam hal itu, dengan data Anda, 4 dari satu tanda dan 8 lainnya, tes tanda dua sisi tidak akan mendekati penolakan pada tingkat signifikansi tertentu. Inilah analisis dalam R:
Nilai p cukup tinggi.
Sekarang jika Anda siap untuk menetapkan skor (atau bahkan hanya untuk memberi peringkat) ke ukuran relatif dari perubahan peringkat dalam setiap pasangan - yaitu, apakah perubahan "baik" menjadi "buruk" pelanggan 2 lebih besar, lebih kecil atau sama dengan pelanggan 4 "sangat bagus" menjadi "oke", dan seterusnya, maka Anda dapat menerapkan tes peringkat yang ditandatangani pada peringkat tersebut atau dengan melakukan tes permutasi berpasangan pada skor yang diberikan (meskipun Anda juga harus berurusan dengan ikatan yang berat, ini bisa dilakukan dengan mengubah urutan peringkat atau skor yang Anda miliki).
Ada beberapa pilihan lain yang mungkin Anda pertimbangkan - tetapi saya tidak berpikir pilihan analisis akan mengubah hasilnya; Saya pikir mereka semua akan gagal menolak pada level signifikansi tipikal pada data ini.
sumber
very bad
kegood
sepenuhnya identik dengan perubahan daribad
kevery good
, Anda tidak dapat mengklaimnya setelah Anda kode sebagai angka ... (Anda memiliki data ordinal yang tergantung. Anda harus menggunakan uji peringkat bertanda Wilcoxon untuk menguji perbedaan yang signifikan antara kedua produk di semua pelanggan.
Namun mengingat data di atas, tes peringkat-bertanda Wilcoxon tidak memberikan hasil yang signifikan.
sumber
good
,bad
) atau (very good
,okay
) ke serangkaian peringkat yang ditandatangani, karena ini akan membuat asumsi yang dibuat di sepanjang jalan menjadi lebih jelas.Gunakan uji- t berpasangan
Selama Anda memiliki peringkat cukup (15 sudah cukup, dan saya akan senang bahkan dengan lebih sedikit) dan beberapa variasi perbedaan peringkat, tidak ada masalah sama sekali menggunakan uji- t berpasangan . Kemudian Anda mendapatkan perkiraan yang sangat mudah untuk ditafsirkan - peringkat rata-rata pada skala numerik 1-5 + perbedaannya (antara produk).
Kode r
Sangat mudah dilakukan di R:
Pertama mari kita periksa peringkat rata-rata:
Dan uji- t memberi kita:
Data palsu?
Anehnya, dan secara tak terduga, t -test yang tidak berpasangan memberikan nilai p yang lebih rendah .
Ini menunjukkan bahwa contoh data palsu. Untuk data nyata, orang akan mengharapkan korelasi positif (cukup tinggi) antara peringkat dari pelanggan yang sama. Di sini korelasinya negatif (walaupun secara statistik tidak signifikan):
Data tidak ada
Ketika tidak semua pelanggan memberi nilai kedua produk (yaitu, data tidak seimbang), pendekatan yang lebih baik menggunakan model efek campuran:
Pertama-tama mari kita konversi data ke bentuk numerik:
Dan mengubahnya menjadi bentuk 'panjang':
Dan akhirnya cocok dengan model efek campuran dengan pelanggan sebagai efek acak:
Ringkasan
Singkatnya, gunakan uji- t berpasangan . Kemudian Anda mendapatkan perkiraan yang mudah diinterpretasikan (rata-rata numerik sederhana).
Jika tidak semua pelanggan memberi peringkat kedua produk, gunakan model efek campuran. (Ini akan memberikan kira-kira hasil yang sama seperti dipadankan t -test ketika mereka telah semua dinilai baik produk, sehingga Anda mungkin juga selalu menggunakannya.)
sumber