Dalam kondisi apa sebaiknya skala Likert digunakan sebagai data ordinal atau interval?

52

Banyak studi dalam ilmu sosial menggunakan skala Likert. Kapan waktu yang tepat untuk menggunakan data Likert sebagai ordinal dan kapan waktu yang tepat untuk menggunakannya sebagai data interval?

Singa
sumber
6
Secara teknis skala Likert adalah jumlah item tipe-Likert dan akhirnya menjadi perkiraan yang masuk akal (setidaknya menurut banyak psikometri dalam Psikologi) dari titik data interval.
russellpierce
2
@drknexus - Jadi, banyak item berfungsi sebagai triangulasi pengukuran untuk skala konstruksi? Jika ya, apa kriteria untuk menentukan bahwa seorang peneliti memiliki poin data yang cukup relevan (yaitu, item) untuk menggunakan skala sebagai pengukuran interval?
A Lion
2
Saya tidak yakin; itu mungkin pertanyaan yang layak bagi masyarakat secara umum. Saya kira itu mungkin sebagian penilaian nilai pada bagian peneliti & area. Beberapa area benar-benar bersedia untuk memperlakukan item Likert tunggal sebagai interval meskipun itu jelas ordinal. Jawaban yang masuk akal mungkin menggunakan metode analisis yang berbeda, misalnya tes permutasi atau bootstrap. Jawaban lain mungkin untuk melakukan tes sederhana normalitas, selama agregat tidak secara signifikan menyimpang dari normalitas Anda mungkin baik-baik saja.
russellpierce
1
... tetapi secara umum sepertinya seseorang dapat membangkitkan teorema batas pusat dan menyarankan bahwa 20 hingga 30 item harus cukup untuk menggunakan skala sebagai pengukuran interval.
russellpierce

Jawaban:

41

Mungkin sudah terlambat tetapi saya tetap menambahkan jawaban saya ...

Itu tergantung pada apa yang ingin Anda lakukan dengan data Anda: Jika Anda tertarik untuk menunjukkan bahwa skor berbeda ketika mempertimbangkan kelompok peserta yang berbeda (jenis kelamin, negara, dll.), Anda dapat memperlakukan skor Anda sebagai nilai numerik, asalkan memenuhi asumsi yang biasa tentang varians (atau bentuk) dan ukuran sampel. Jika Anda agak tertarik menyoroti bagaimana pola respons bervariasi di seluruh subkelompok, maka Anda harus mempertimbangkan skor item sebagai pilihan terpisah di antara serangkaian opsi jawaban dan mencari pemodelan log-linear, regresi logistik ordinal, model respons item, atau model statistik lainnya yang memungkinkan untuk mengatasi barang-barang politis.

Sebagai aturan umum, orang umumnya menganggap bahwa memiliki 11 titik berbeda pada skala cukup untuk mendekati skala interval (untuk tujuan interpretasi, lihat komentar @ xmjx)). Item likert dapat dianggap sebagai skala ordinal yang benar, tetapi mereka sering digunakan sebagai numerik dan kita dapat menghitung rata-rata atau SD mereka. Ini sering dilakukan dalam survei sikap, meskipun bijaksana untuk melaporkan rata-rata / SD dan% dari respons dalam, misalnya dua kategori tertinggi.

Ketika menggunakan skor skala yang dijumlahkan (yaitu, kami menambahkan skor pada setiap item untuk menghitung "skor total"), statistik biasa dapat diterapkan, tetapi Anda harus ingat bahwa Anda sekarang bekerja dengan variabel laten sehingga konstruk yang mendasarinya harus masuk akal! Dalam psikometrik, kami umumnya memeriksa bahwa (1) unidimensionnality dari skala berlaku, (2) skala reliabilitas sudah cukup. Ketika membandingkan dua skor skala tersebut (untuk dua instrumen yang berbeda), kami bahkan mungkin mempertimbangkan untuk menggunakan ukuran korelasi yang dilemahkan alih-alih koefisien korelasi Pearson klasik.

Buku teks klasik meliputi:
1. Nunnally, JC dan Bernstein, IH (1994). Teori Psikometrik (edisi ke-3). Seri McGraw-Hill dalam Psikologi.
2. Streiner, DL dan Norman, GR (2008). Timbangan Pengukuran Kesehatan. Panduan praktis untuk pengembangan dan penggunaannya (edisi ke-4). Oxford.
3. Rao, CR dan Sinharay, S., Eds. (2007). Buku Pegangan Statistik, Vol. 26: Psikometri . Elsevier Science BV
4. Dunn, G. (2000). Statistik dalam Psikiatri . Hodder Arnold.

Anda juga dapat melihat Aplikasi sifat laten dan model kelas laten dalam ilmu sosial , dari Rost & Langeheine, dan situs web W. Revelle tentang penelitian kepribadian .

Ketika memvalidasi skala psikometrik, penting untuk melihat apa yang disebut efek plafon / lantai (asimetri besar yang dihasilkan dari peserta yang mencetak pada kategori respons terendah / tertinggi), yang dapat berdampak serius pada statistik apa pun yang dihitung ketika memperlakukannya sebagai variabel numerik ( misal, agregasi negara, uji-t). Hal ini menimbulkan masalah khusus dalam studi lintas budaya karena diketahui bahwa distribusi respons keseluruhan dalam sikap atau survei kesehatan berbeda dari satu negara ke negara lain (misalnya orang Cina vs. mereka yang berasal dari negara-negara barat cenderung menyoroti pola respons khusus, yang sebelumnya memiliki umumnya skor yang lebih ekstrem di tingkat item, lihat misalnya Song, X.-Y. (2007) Analisis model persamaan struktural multisampel dengan aplikasi untuk data Kualitas Hidup, dalamBuku Pegangan Variabel Laten dan Model Terkait , Lee, S.-Y. (Ed.), Hlm. 279-302, Belanda Utara).

Secara lebih umum, Anda harus melihat literatur terkait psikometrik yang memanfaatkan item Likert secara luas jika Anda tertarik dengan masalah pengukuran. Berbagai model statistik telah dikembangkan dan saat ini dipimpin di bawah kerangka Item Response Theory.

chl
sumber
2
Hanya untuk klarifikasi: Nunnally / Bernstein menyarankan untuk memperlakukan variabel sebagai kontinu jika memiliki setidaknya 11 nilai yang berbeda (p. 115). Di mana aturan "12 poin menyiratkan skala interval" praktis?
xmjx
12

Jawaban sederhananya adalah bahwa skala Likert selalu ordinal. Interval antara posisi pada skala adalah monotonik tetapi tidak pernah didefinisikan dengan baik sebagai kenaikan yang seragam secara numerik.

Yang mengatakan, perbedaan antara ordinal dan interval didasarkan pada tuntutan spesifik dari analisis yang dilakukan. Dalam keadaan khusus, Anda mungkin dapat memperlakukan respons seolah-olah jatuh pada skala interval. Untuk melakukan ini, biasanya para responden harus dalam persetujuan yang dekat mengenai arti dari skala tanggapan dan analisis (atau keputusan yang dibuat berdasarkan analisis) harus relatif tidak sensitif terhadap masalah yang mungkin timbul.

Tom
sumber
8
John Tukey menulis sebaliknya (tahun 1960) dalam sebuah monograf "Analisis Data dan Ilmu Perilaku" (diterbitkan dalam Collected Works v. III). Salah satu hasil yang diperolehnya adalah bahwa jika Anda menjadi lebih baik dari sekitar 10% perjanjian tes-tes ulang, skala Anda tidak cukup sempit!
whuber
Jawaban ini tampaknya membingungkan skala Likert dengan item peringkat asli. Lihat komentar @ russellpierce.
rolando2
9

Selain apa yang telah dikatakan di atas tentang skala rangkuman, saya juga menyebutkan bahwa masalah ini dapat berubah ketika menganalisis data di tingkat kelompok. Misalnya, jika Anda sedang memeriksa

  • kepuasan hidup negara bagian atau negara,
  • kepuasan kerja organisasi atau departemen,
  • kepuasan siswa dalam mata pelajaran.

Dalam semua kasus ini setiap ukuran agregat (mungkin rata-rata) didasarkan pada banyak respons individu (misalnya, n = 50, 100, 1000, dll.). Dalam kasus ini item Likert asli mulai mengambil sifat yang menyerupai skala interval pada tingkat agregat.

Jeromy Anglim
sumber
-2

skala likert selalu dalam bentuk ordinal: Suatu metode yang menganggap nilai kuantitatif sebagai data kualitatif, agar dapat menerima analisis statistik. Nilai numerik diberikan untuk setiap pilihan potensial dan angka rata-rata untuk semua respons dihitung pada akhir evaluasi atau survei.

mubashara hussain
sumber
5
Selamat datang di situs kami! Harap cantumkan kutipan Anda atau, secara umum, kata-kata yang Anda pinjam dari orang lain.
whuber