Saya memiliki beberapa data ordinal yang diperoleh dari pertanyaan survei. Dalam kasus saya, mereka adalah respons gaya likert (Sangat Tidak Setuju-Tidak Setuju-Netral-Setuju-Sangat Setuju). Dalam data saya mereka diberi kode 1-5.
Saya tidak berpikir cara berarti banyak di sini, jadi statistik ringkasan dasar apa yang dianggap berguna?
descriptive-statistics
likert
ordinal-data
PaulHurleyuk
sumber
sumber
Jawaban:
Tabel frekuensi adalah tempat yang baik untuk memulai. Anda dapat melakukan penghitungan, dan frekuensi relatif untuk setiap level. Juga, jumlah total, dan jumlah nilai yang hilang dapat digunakan.
Anda juga dapat menggunakan tabel kontingensi untuk membandingkan dua variabel sekaligus. Dapat ditampilkan menggunakan plot mosaik juga.
sumber
Saya akan berdebat dari sudut pandang terapan bahwa mean sering merupakan pilihan terbaik untuk merangkum kecenderungan sentral dari item Likert. Secara khusus, saya memikirkan konteks seperti survei kepuasan siswa, skala penelitian pasar, survei pendapat karyawan, item tes kepribadian, dan banyak item survei ilmu sosial.
Dalam konteks seperti itu, konsumen penelitian sering menginginkan jawaban atas pertanyaan seperti:
Untuk tujuan ini, rata-rata memiliki beberapa manfaat:
1. Berarti mudah untuk dihitung:
2. Berarti relatif dipahami dengan baik dan intuitif:
0, 0, 0, 1, 1
coding.3. Mean adalah angka tunggal:
4. Tidak ada bedanya
sumber
Untuk ringkasan dasar, saya setuju bahwa tabel frekuensi pelaporan dan beberapa indikasi tentang kecenderungan pusat baik-baik saja. Sebagai kesimpulan, sebuah artikel baru-baru ini yang diterbitkan dalam PARE membahas uji t-vs. MWW, Butir-Butir Lima Poin: uji t versus Mann-Whitney-Wilcoxon .
Untuk perawatan lebih lanjut, saya akan merekomendasikan membaca ulasan Agresti pada variabel kategori yang dipesan:
Ini sebagian besar melampaui statistik biasa, seperti model berbasis ambang (misalnya rasio odds proporsional), dan layak dibaca sebagai pengganti buku CDA Agresti .
Di bawah ini saya perlihatkan gambar tiga cara berbeda dalam memperlakukan item Likert; dari atas ke bawah, tampilan "frekuensi" (nominal), tampilan "numerik", dan tampilan "probabilistik" ( Model Kredit Sebagian ):
Data berasal dari
Science
data dalamltm
paket, di mana item terkait teknologi ("Teknologi baru tidak tergantung pada penelitian ilmiah dasar", dengan respons "sangat tidak setuju" untuk "sangat setuju", pada skala empat poin)sumber
Praktik konvensional adalah menggunakan statistik jumlah non-parametrik dan jumlah rata - rata untuk menggambarkan data ordinal.
Begini cara kerjanya:
Jumlah Peringkat
menetapkan peringkat untuk setiap anggota di setiap kelompok;
mis. misalkan Anda melihat gol untuk setiap pemain di dua tim sepak bola yang berlawanan kemudian rangking setiap anggota pada kedua tim dari pertama hingga terakhir;
menghitung jumlah peringkat dengan menambahkan peringkat per kelompok ;
besarnya jumlah peringkat memberi tahu Anda seberapa dekat peringkat tersebut untuk setiap kelompok
Peringkat Berarti
M / R adalah statistik yang lebih canggih daripada R / S karena ini mengkompensasi ukuran yang tidak sama dalam kelompok yang Anda bandingkan. Karenanya, selain langkah-langkah di atas, Anda membagi setiap jumlah dengan jumlah anggota dalam grup.
Setelah Anda memiliki dua statistik ini, Anda dapat, misalnya, uji z jumlah rangking untuk melihat apakah perbedaan antara kedua kelompok secara statistik signifikan (saya percaya itu dikenal sebagai tes jumlah rangking Wilcoxon , yang dapat dipertukarkan, yaitu, secara fungsional setara dengan tes Mann-Whitney U).
R Fungsi untuk statistik ini (yang saya tahu tentangnya):
wilcox.test dalam instalasi R standar
Meanranks dalam Paket engkol
sumber
Berdasarkan abstrak, artikel ini dapat membantu untuk membandingkan beberapa variabel yang berskala likert. Ini membandingkan dua jenis tes perbandingan berganda non-parametrik: Satu berdasarkan peringkat dan satu berdasarkan tes oleh Chacko. Ini termasuk simulasi.
sumber
Saya biasanya suka menggunakan plot Mosaic. Anda dapat membuatnya dengan mengecewakan kovariat lain yang diminati (seperti: jenis kelamin, faktor bertingkat, dll.)
sumber
Saya setuju dengan evaluasi Jeromy Anglim. Ingat bahwa respons Likert adalah perkiraan - Anda tidak menggunakan penggaris yang benar-benar dapat diandalkan untuk mengukur objek fisik dengan dimensi stabil. Mean adalah ukuran yang kuat ketika menggunakan ukuran sampel yang masuk akal.
Dalam bisnis dan produk R&D, rerata sejauh ini adalah statistik yang paling umum digunakan dengan skala Likert. Ketika menggunakan skala Likert saya biasanya memilih ukuran yang idealnya cocok dengan pertanyaan penelitian. Misalnya, jika Anda berbicara tentang "preferensi" atau "sikap" Anda dapat menggunakan beberapa indikator berbasis Likert, dengan masing-masing indikator memberikan wawasan yang sedikit berbeda.
Untuk mengevaluasi pertanyaan "bagaimana orang-orang di segmen bereaksi terhadap penawaran layanan ," Saya dapat melihat (1) rata-rata aritmatika, (2) median tepat, (3) persentase respons paling menguntungkan (kotak atas), (4)% dua kotak teratas, (5) rasio dua kotak teratas ke dua kotak paling bawah, (6) persentase dalam kotak menengah ... dll. Setiap ukuran menceritakan bagian cerita yang berbeda. Dalam proyek yang sangat kritis, saya menggunakan beberapa indikator berbasis Likert. Saya juga akan menggunakan banyak indikator dengan sampel kecil dan ketika tab lintas tertentu memiliki struktur "menarik" atau terlihat kaya informasi. Ahhh ... seni statistik.i X
sumber
"Kotak skor" sering digunakan untuk merangkum data ordinal, terutama ketika datang dengan jangkar verbal yang bermakna. Dengan kata lain, Anda dapat melaporkan "2 kotak teratas", persentase yang memilih "setuju" atau "sangat setuju".
sumber