Saya butuh sedikit bantuan untuk menyelamatkan data dari kuesioner.
Salah satu kolega saya menerapkan kuesioner, tetapi secara tidak sengaja, alih-alih menggunakan skala Likert 5 poin asli (sangat tidak setuju untuk sangat setuju), ia memasukkan jawaban ke-6 ke dalam skala. Dan, untuk memperburuk masalah ini, opsi respons ke-6 adalah ... "Saya tidak tahu".
Masalahnya adalah sebagian besar responden yang, pada satu titik atau lain, memilih "Saya tidak tahu". Jika persentase mereka cukup kecil, saya baru saja mengeluarkan mereka dari database. Namun, inti dari penelitian ini terletak pada model konseptual, dan mengecualikan begitu banyak catatan akan menciptakan masalah bagi model.
Bisakah seseorang mengarahkan saya ke arah yang benar di sini? Adakah 'praktik yang baik', atau bisakah saya melakukan apa saja untuk menggunakan (mengubah, mengubah, dll.) Itu tanggapan "Saya tidak tahu"?
Juga, jika saya melakukan manipulasi data yang dipermasalahkan (yaitu, jika saya mengonversi respons "Saya tidak tahu", dengan substitusi, imputasi, dll.), 'Disclaimer', 'warning', annotation, seperti apa, yang harus saya gunakan?
Saya tahu ini sangat sulit, tetapi saya akui, selain menyelamatkan tanggapan, saya juga ingin tahu apa praktik yang disepakati (jika ada), dalam kasus-kasus seperti ini.
PS: Saya tahu kedengarannya kekanak-kanakan, tapi tidak, 'kolega' itu bukan saya :)
sumber
Jawaban:
Mengapa mencoba memaksakan kalibrasi pada sesuatu yang tidak benar? Seperti yang dikatakan Maarten, ini bukan kehilangan data tetapi perolehan informasi. Jika pil ajaib yang Anda cari ada, itu berarti ada beberapa asumsi tentang populasi Anda yang dibuat, misalnya, bias yang mendukung satu label tertentu meskipun pengguna mengatakan "Saya tidak tahu".
Saya benar-benar memahami frustrasi Anda tetapi cara yang tepat untuk mendekati masalah adalah dengan memodifikasi model agar sesuai dengan kebutuhan Anda berdasarkan data yang ada yang sebenarnya, dan bukan sebaliknya (memodifikasi data).
sumber
Jika ini adalah kuesioner standar yang telah divalidasi secara independen, maka Anda tidak dapat mengklaim bahwa kuesioner baru itu setara, dan data tidak lagi dapat dibandingkan. Anda dapat mencoba untuk memvalidasi dan memeriksa kuesioner dalam percobaan terpisah (sangat memakan waktu dan usaha, terutama jika Anda juga ingin menunjukkan komparabilitas dengan versi lama) atau hanya menerima bahwa Anda berurusan dengan kualitas bukti yang lebih rendah (karena data Anda datang dari kuesioner yang tidak divalidasi).
Ketika Anda menggunakan data Anda, Anda harus mempertimbangkan perubahan itu. Ketika dihadapkan dengan pertanyaan sikap, orang tidak memberi Anda jawaban yang "benar secara objektif", mereka memberi Anda jawaban yang mereka rasa benar - dan ini tentu saja dipengaruhi oleh pilihan jawaban yang tersedia (mereka "menormalkan" jawaban mereka untuk skala) dan pengetahuan yang mereka miliki tentang subjek (ada bias yang diketahui bekerja secara berbeda, kadang-kadang dalam arah yang berbeda (!) tergantung pada apakah peserta memiliki banyak atau sedikit pengetahuan tentang materi pelajaran).
Jadi, jika kita berhadapan dengan quititonnaire yang sudah mapan, Anda memiliki opsi yang bagus untuk perbandingan antara versi kuesioner Anda dan yang asli. Jika yang asli berasumsi bahwa orang tahu apa yang mereka pilih, dan ternyata mereka tidak, Anda dapat mendiskusikan bagaimana model lama didasarkan pada asumsi yang salah, dan apa konsekuensi dari itu. Perhatikan bahwa ini adalah penemuan "sisi", yang membuat pertanyaan penelitian baru yang bagus, tetapi menjauhkan Anda dari yang asli, dan memang menunjukkan bahwa menjawab yang asli jauh lebih sulit daripada yang diperkirakan, sehingga tentu saja melipatgandakan pekerjaan Anda.
Jika Anda tidak berurusan dengan kuesioner yang sudah ada, Anda dapat mengikuti arus dan berpura-pura bahwa kuesioner ad-hoc Anda direncanakan seperti itu, dan mengevaluasi hasilnya. Sekali lagi, ini mungkin berarti bahwa hasil yang Anda harapkan tidak dapat diperoleh dengan metode ini, tetapi ini juga merupakan hal yang penting untuk diketahui.
Untuk pemahaman yang baik tentang bagaimana kata-kata dan pilihan mempengaruhi cara kuesioner dijawab, saya sarankan membaca "Psikologi respon survei" Tourangeau et al. Ini adalah bacaan yang bagus untuk semua orang yang pernah membuat kuesioner.
sumber
Jika Anda bertanya berapa banyak anak yang melahirkan responden, jawaban "nol" dan "tidak berlaku" tidak akan berarti hal yang sama, karena laki-laki tidak dapat melahirkan.
Untuk beberapa konteks, menyamakan "Saya tidak tahu" dengan respons netral bisa juga merupakan kesalahan konseptual.
Sebenarnya, Anda memiliki dua pertanyaan: dikotomis, "Apakah Anda punya pendapat?" dan sebuah ordinal "Apa itu?", sama seperti, di atas, Anda memiliki implisit "Apakah Anda seorang wanita?" melampaui pertanyaan eksplisit Anda.
Tentu saja, Anda dapat memperkenalkan beberapa asumsi (kadang-kadang dengan benar, kadang-kadang hanya untuk kenyamanan, kadang-kadang dengan terpaksa) untuk memberi Anda beberapa pemodelan, tetapi saya tidak dapat melihat strategi yang dapat diterapkan secara universal tanpa memasuki bidang spesifik fenomena Anda.
Sebagai poin terakhir yang dipikirkan, tidak masuk akal untuk mencoba dan menyimpulkan apa pun pada populasi pria dari jawaban kesuburan wanita.
sumber
Dilema apakah orang harus memasukkan atau tidak opsi jawaban Tidak tahu ke dalam kuesioner yang terdiri dari skala penilaian dari jenis Likert adalah abadi. Seringkali, ketika item bertanya tentang pendapat, DK dimasukkan karena tidak memiliki pendapat adalah status penting sendiri dan pilihan seperti itu diharapkan oleh responden. Dalam inventaris sifat pribadi di mana orang menganggap kualitas pada target, opsi DK biasanya dibatalkan karena responden biasanya diharapkan dapat menilai tingkat afinitas suatu karakteristik (yaitu, responden selalu dianggap memenuhi syarat); dan ketika dia sesekali menemukan kesulitan dia diizinkan (dengan instruksi) untuk melewati item itu. Dalam inventaris sifat pribadi di mana orang menggambarkan target (item perilaku) DK (atau tidak
@Hatim dalam jawabannya, @ Maarten dan beberapa komentator lain dari pertanyaan OP telah dengan masuk akal menyatakan bahwa sejumlah besar tanggapan DK yang diamati dalam penelitian ini menunjukkan masalah (validitas isi atau valitity wajah) dalam item atau bahwa subjek tidak tidak cocok dengan kuesioner yang diperintahkan kepada mereka.
Tetapi Anda tidak akan pernah bisa menceritakan kisah itu, pada akhirnya interpretasi dari rintangan ada pada Anda (kecuali jika Anda mengatasinya dalam penyelidikan terpisah). Orang bisa mengklaim, misalnya, bahwa dimasukkannya opsi DK ke likerts dalam kuesioner itu (katakanlah, itu adalah inventori anggapan sifat) berfungsi buruk, tidak baik. Itu tidak memberi Anda informasi (yang komentator katakan, itu
it proves that the [rating] model is inadequate
) tetapi agak mengganggu / merayu responden. Baik itu tidak disediakan keputusan peringkat yang dipandu oleh skema sifat kognitif implisit bisa saja ditimbulkan; tetapi melihat opsi pendinginan menghalangi skema dan membuat satu buru-buru untuk mundur.Jika Anda selanjutnya mengakui - pada risiko Anda, tetapi mengapa tidak? - bahwa subjek yang mudah terganggu atau malas adalah subjek yang potensinya, pandangannya mundur valid tetapi cenderung terdiferensiasi dengan lemah - yaitu, ia akan dengan mudah memanggil das Man konvensional , di tempat Erlebnis pribadi , skema - maka Anda mungkin akan berspekulasi bahwa tanggapannya yang hilang adalah sekitar mean sampel atau populasi untuk item tersebut. Jika demikian, mengapa tidak mengganti (+ noise) yang berarti dari tanggapan yang hilang? Atau Anda mungkin melakukan EM atau penyesalan (+ noise) imputasi untuk memperhitungkan korelasi.
Untuk mengulang: keputusan imputasi mungkin tetapi berisiko, dan tidak mungkin, mengingat sejumlah besar data yang hilang, untuk mengembalikan "benar-benar" data yang tidak ada. Seperti yang dikatakan @rumtscho, tentu saja bahwa kuesioner baru dengan DK tidak setara dengan yang asli tanpa DK, dan data tidak lagi dapat dibandingkan.
Ini adalah spekulasi. Tetapi pertama-tama, Anda harus mencoba untuk menyelidiki pola hilangnya yang diamati. Siapa subyek yang memilih DK? Apakah mereka mengelompok bersama dalam subtipe? Bagaimana mereka berbeda pada item lainnya dari subsampel "oke"? Beberapa perangkat lunak memiliki paket Analisis Nilai Hilang. Kemudian Anda dapat memutuskan apakah akan menjatuhkan orang seluruhnya atau sebagian, atau menyalahkan, atau menganalisis mereka sebagai subsampel yang terpisah.
PS Perhatikan juga bahwa responden "bodoh". Mereka sering hanya bergaul dengan nilai skala. Sebagai contoh, jika titik DK ditempatkan dekat dengan salah satu kutub skala, hal itu akan sering menjadi bingung oleh kurangnya perhatian dengan kutub itu. Saya tidak bercanda.
sumber
Anda sekarang memiliki responden yang dipilih sendiri karena memiliki pendapat tentang masalah tersebut. Apa pun yang Anda simpulkan hanya tentang orang-orang itu. Ini mungkin OK, karena polling yang "tidak tahu" menurut definisi kurang bermanfaat.
sumber