Apakah pantas untuk memperlakukan data skala Likert titik-n sebagai uji coba dari proses binomial?

11

Saya tidak pernah menyukai bagaimana orang biasanya menganalisis data dari skala Likert seolah-olah kesalahan terjadi terus-menerus & Gaussian ketika ada harapan yang masuk akal bahwa asumsi-asumsi ini dilanggar setidaknya pada skala ekstrim. Apa pendapat Anda tentang alternatif berikut:

Jika respon mengambil nilai pada skala-titik, memperluas data tersebut untuk percobaan, yang memiliki nilai 1 dan yang memiliki nilai 0. Jadi, kita memperlakukan respon pada skala Likert seolah-olah itu adalah agregat terbuka dari serangkaian percobaan binomial terselubung (pada kenyataannya, dari perspektif ilmu kognitif, ini sebenarnya merupakan model yang menarik untuk mekanisme yang terlibat dalam skenario pengambilan keputusan seperti itu). Dengan data yang diperluas, Anda sekarang dapat menggunakan model efek campuran yang menetapkan responden sebagai efek acak (juga pertanyaan sebagai efek acak jika Anda memiliki beberapa pertanyaan) dan menggunakan fungsi tautan binomial untuk menentukan distribusi kesalahan.kn k n - knnknk

Adakah yang bisa melihat dugaan pelanggaran atau aspek merugikan lain dari pendekatan ini?

Mike Lawrence
sumber
2
Apakah Anda tahu ada penelitian yang dipublikasikan yang melihat manfaat relatif menggunakan skala likert sebagai interval vs data ordinal? Mungkin, kekurangan memperlakukan mereka sebagai skala level interval tidak cukup serius untuk menjamin pendekatan yang kompleks. Jika itu masalahnya maka pendekatan Anda mungkin hanya pengejaran angsa liar.

Jawaban:

16

Saya tidak tahu ada artikel yang terkait dengan pertanyaan Anda dalam literatur psikometri. Sepertinya saya bahwa model logistik yang dipesan yang memungkinkan komponen efek acak dapat menangani situasi ini dengan cukup baik.

Saya setuju dengan @Srikant dan berpikir bahwa model odds proporsional atau model probit terurut (tergantung pada fungsi tautan yang Anda pilih) mungkin lebih baik mencerminkan pengkodean intrinsik dari item Likert, dan penggunaannya sebagai skala penilaian dalam survei opini / sikap atau kuesioner. .

Alternatif lain adalah: (1) penggunaan kategori yang berdekatan, bukan proporsional atau kumulatif (di mana ada hubungan dengan model log-linear); (2) penggunaan model respons barang seperti model kredit parsial atau model skala penilaian (seperti yang disebutkan dalam tanggapan saya tentang analisis skala Likert ). Kasus terakhir sebanding dengan pendekatan efek campuran, dengan subyek diperlakukan sebagai efek acak, dan sudah tersedia dalam sistem SAS (misalnya, model pas efek campuran untuk hasil ordinal berulang dengan prosedur NLMIXED ) atau R (lihat vol. 20 dari Journal of Software statistik ). Anda mungkin juga tertarik dengan diskusi yang disediakan oleh John Linacre tentang Mengoptimalkan Keefektifan Kategori Skala Penilaian .

Makalah berikut ini mungkin juga berguna:

  1. Wu, CH (2007). Studi Empiris tentang Transformasi Data Skala Likert menjadi Skor Numerik . Ilmu Matematika Terapan , 1 (58) : 2851-2862.
  2. Rost, J dan dan Luo, G (1997). Penerapan Model Unfolding Berbasis Rasch untuk Kuisioner pada Remaja Centrism . Di Rost, J dan Langeheine, R (Eds.), Penerapan sifat laten dan model kelas laten dalam ilmu sosial , New York: Waxmann.
  3. Lubke, G dan Muthen, B (2004). Analisis faktor data skala Likert dengan asumsi normalitas multivariat mempersulit perbandingan yang bermakna antara kelompok yang diamati atau kelas laten . Pemodelan Persamaan Struktural , 11 : 514-534.
  4. Nering, ML dan Ostini, R (2010). Buku Pegangan Model Teori Respon Item Polytomous . Routledge Academic
  5. Bender R dan Grouven U (1998). Menggunakan model regresi logistik biner untuk data ordinal dengan peluang non-proporsional. Jurnal Epidemiologi Klinik , 51 (10) : 809-816. (Tidak dapat menemukan pdf tetapi yang ini tersedia, Regresi logistik ordinal dalam penelitian medis )
chl
sumber
1
Efek campuran regresi logistik ordinal juga tersedia dalam R dengan paket ordinal dan clmm ().
John
9

Jika Anda benar-benar ingin mengabaikan asumsi data level interval untuk skala likert, saya sarankan Anda menganggap data sebagai logit atau probit yang dipesan. Skala likert biasanya mengukur kekuatan respons dan karenanya nilai yang lebih tinggi harus menunjukkan respons yang lebih kuat pada item yang menjadi dasar minat.

Misalkan Anda memiliki skala item dan mewakili kekuatan respons yang tidak teramati pada item yang diminati. Kemudian Anda dapat mengasumsikan model respons berikut:SHS

S α 1y=1 jikaSα1

α h - 1 < S α h h = 2 , 3 , . . H - 1y=h  jika untukαh1<S αhh=2,3,..H1

α H - 1 < S < y=H  jikaαH1<S< 

Dengan asumsi bahwa mengikuti distribusi normal dengan mean dan varian yang tidak diketahui akan memberikan model probit yang dipesan.S


sumber
2

Satu kekhawatiran adalah bahwa dengan menggunakan pendekatan ini Anda memaksakan hubungan spesifik antara mean dan variance dari respon. Untuk jenis survei, skala Likert sering digunakan dalam - misalnya Anda memilih satu dari lima kategori dari antara "Sangat setuju" hingga "Sangat tidak setuju" sehubungan dengan beberapa pernyataan atau lainnya - rasanya salah bagi saya. Sebagai contoh, saya mengharapkan skala sepuluh poin untuk memberikan distribusi tanggapan yang kira-kira sama dengan skala lima poin jika Anda menciutkan pasangan kategori yang berdekatan: untuk respons &npnp(1p)yp

Prn=4(Y=y)Prn=9(Y=2y)+Prn=9(Y=2y+1)
Saya ingat beberapa penelitian yang tampaknya membuktikan hal ini: Coelho & Esteves (2006), "Pilihan antara skala lima poin dan sepuluh poin dalam kerangka pengukuran kepuasan pelanggan".
Scortchi - Reinstate Monica
sumber
1

Anda bisa menggunakan pendekatan binomial dalam skala Likert 5-pt jika Anda menggabungkan setuju dan sangat setuju ke dalam satu kelompok & tidak setuju dan sangat tidak setuju ke yang lain. Tentu saja, Anda masih perlu memutuskan ke mana tujuan netral. Saya akan meletakkan netral dalam satu kelompok, menggunakan perkiraan normal untuk binomial (asalkan Anda memiliki lebih dari 40 tanggapan), dan mengembangkan interval kepercayaan pada proporsi masing-masing kelompok (lihat teks stat standar tentang cara mendapatkan conf. interval pada proporsi yang berasal dari distribusi binomial dengan perkiraan normal). Kemudian, saya akan meletakkan netral di grup lain, dan mengulang interval kepercayaan. Jika saya mendapatkan kesimpulan yang sama dari keduanya, maka ada kemungkinan kesimpulan. Kalau tidak, saya tidak melihat bagaimana binomial dapat digunakan dengan data Likert.

pengguna35193
sumber
0

Jika saya mengerti dengan benar, makalah ini menyarankan pendekatan yang sangat mirip dengan apa yang telah Anda gambarkan, menunjukkan bahwa ya, memang, data seperti likert dapat naik dari proses binomial.

Ref Penuh: Allik, J. (2014). Model binomial campuran untuk ukuran kepribadian tipe-Likert. Frontiers in Psychology , (5) 371

KasiaM
sumber
Selamat datang di situs ini! Bisakah Anda menambahkan referensi lengkap untuk makalah itu? Ini praktik standar di sini karena tautannya cenderung mati.
mkt - Pasang kembali Monica
-1

Sebenarnya saya sedang menyiapkan makalah di mana saya menggunakan pendekatan Anda memperlakukan tanggapan pada item likert seolah-olah itu adalah agregat terbuka dari serangkaian percobaan binomial rahasia.

Dalam makalah saya distribusi binomial digunakan untuk menjelaskan bentuk distribusi frekuensi yang diamati. Alasan di balik pendekatan ini diberikan oleh dua asumsi. Dalam banyak applet, menunjukkan bagaimana distribusi binomial muncul, seseorang telah mengulangi uji coba independen Bernoulli dengan satu bola jatuh melalui array pin. Setiap kali bola jatuh ke pin, itu akan memantul ke kanan (yaitu sukses) dengan probabilitas p atau ke kiri (yaitu kegagalan) dengan probabilitas 1-p. Setelah bola jatuh melalui susunan, bola itu mendarat di tempat sampah yang berlabel jumlah keberhasilan yang sesuai. Dalam makalah saya proses pengambilan keputusan juga dilihat sebagai serangkaian uji coba Bernoulli independen yang berulang-ulang di mana, pada setiap uji coba, subjek memutuskan untuk setuju atau tidak untuk menyetujui pernyataan yang dimaksud.

(i) Pada setiap uji coba independen Bernoulli, subjek membuat keputusan untuk menyetujui probabilitas p atau tidak setuju (tidak setuju) dengan kemungkinan 1-p.

(ii) Jika lima kategori respons tersedia untuk pernyataan, maka berapa kali keputusan Bernoulli dibuat mengenai keputusan untuk setuju atau tidak setuju (tidak setuju) sama dengan 4 (5-1).

Pilihan akhir untuk kategori respons spesifik diberikan oleh aturan berikut.

  • Jika dalam semua (empat) kasus keputusan keputusan Bernoulli dibuat, maka tanggapan 'sangat setuju' akan diberikan.

  • Jika dalam tiga kasus keputusan persetujuan Bernoulli dibuat, maka tanggapan 'setuju' akan diberikan.

  • Jika dalam dua kasus keputusan persetujuan Bernoulli dibuat, maka respons 'bimbang' akan diberikan.

  • Jika hanya dalam satu kasus keputusan Bernoulli tentang kesepakatan dibuat, maka tanggapan 'tidak setuju' akan diberikan.

  • Jika tidak ada keputusan Bernoulli tentang kesepakatan yang dibuat, maka tanggapan 'sangat tidak setuju' akan diberikan.

Alasan yang sama dapat diberikan dengan menggunakan keputusan 'tidak setuju'. Untuk mendapatkan distribusi binomial, penilaian kategori respons adalah sebagai berikut.

sangat tidak setuju = 0, tidak setuju = 1, netral = 2, setuju = 3, sangat setuju = 4

Dua asumsi ini mengarah pada distribusi binomial untuk frekuensi respons asalkan tidak ada perbedaan sistematis antara responden.

Saya harap Anda bisa setuju. Saya akan menilai sangat banyak jika Anda dapat meningkatkan bahasa Inggris saya di teks di atas.

Ad van der Ven
sumber
Saya telah menghapus balasan lama Anda. Harap dicatat bahwa komentar saya tidak dimaksudkan sebagai komentar negatif; balasan satu baris umumnya tidak terlalu informatif dan jawaban yang dapat diperdebatkan lebih disukai (tetapi lihat FAQ kami ).
chl
1
Ini adalah proposal yang menarik & kreatif, tetapi saya ragu akan hal itu. Baik dalam versi Anda & dalam regresi logistik ordinal seperti yang disarankan, misalnya oleh orang lain di utas ini akan membutuhkan asumsi peluang proporsional. Namun, OLR akan memungkinkan ambang / titik potong b / t kategori bervariasi lebih fleksibel, saya percaya, sedangkan mereka akan ditentukan oleh parameter binomial & dalam skema Anda. Asumsi ini harus diverifikasi berdasarkan data, & saya kira, akan menimbulkan masalah. (BTW, -1 tidak datang dari saya.)npn
gung - Reinstate Monica