Misalkan invigilator mencurigai satu siswa menyalin jawaban dari kertas siswa lain selama ujian pilihan ganda. Dia kemudian memeriksa jawaban mereka dan menemukan beberapa kesamaan — tetapi di sisi lain, pasti ada kesamaan karena sifat ujian. Bagaimana seharusnya dia menentukan apakah kecurigaannya terbukti?
Dengan kata lain, dia pasti harus membandingkan ujian dengan ujian siswa lain (yang, mari kita asumsikan, tidak selingkuh). Tetapi jika ukuran kelas sangat besar, apakah masuk akal untuk mengambil sampel acak untuk perbandingan? Berapa banyak yang akan dia ambil? Jika ada banyak pertanyaan pada ujian, apakah masuk akal untuk mengambil sampel pertanyaan untuk perbandingan? Apakah itu membuat perbedaan yang signifikan apakah setiap pertanyaan memiliki 2 kemungkinan jawaban (benar / salah) atau, katakanlah, 4?
Saya tidak memiliki nomor tertentu karena saya ingin tahu bagaimana ini akan bekerja secara umum. Saya memiliki latar belakang matematika tetapi sedikit pelatihan dalam statistik. Bagaimana Anda menggambarkan analisis ini dalam istilah statistik?
Terima kasih.
sumber
Jawaban:
Berikut ini adalah daftar indeks penyalinan jawaban yang mengejutkan, dengan sedikit pembahasan tentang kelebihannya: http://www.bjournal.co.uk/paper/BJASS_01_01_06.pdf .
Ada bidang psikologi (pendidikan) yang disebut teori respons item (IRT) yang menyediakan latar belakang statistik untuk pertanyaan seperti ini. Jika Anda seorang Amerika, dan mengikuti SAT, ACT atau GRE, Anda berurusan dengan tes yang dikembangkan dengan IRT. Postulat dasar IRT adalah bahwa setiap siswa dicirikan oleh kemampuan mereka ; setiap pertanyaan ditandai dengan kesulitannya ; dan probabilitas untuk menjawab pertanyaan dengan benar adalah mana adalah cdf dari standar normal, dani ai bj
Untuk pertanyaan "Ya / Tidak", ini mungkin akhir dari cerita. Untuk lebih dari dua pertanyaan kategori, kita dapat membuat asumsi tambahan bahwa semua pilihan yang salah memiliki kemungkinan yang sama; untuk pertanyaan dengan pilihan , probabilitas setiap pilihan yang salah adalah .j kj π′(ai,bj;c)=[1−π(ai,bj;c)]/(kj−1)
Untuk siswa kemampuan dan , probabilitas bahwa mereka cocok dengan jawaban mereka untuk pertanyaan dengan kesulitan adalah Jika Anda suka, Anda dapat memecah ini menjadi probabilitas pencocokan pada jawaban yang benar, , dan probabilitas untuk mencocokkan jawaban yang salah, , meskipun dari kerangka kerja konseptual IRT, perbedaan ini hampir tidak material.ai ak bj
Sekarang, Anda dapat menghitung probabilitas pencocokan, tetapi mungkin sangat kecil secara kombinasi. Ukuran yang lebih baik mungkin rasio informasi dalam pola tanggapan berpasangan, dan hubungkan ke entropi Anda dapat melakukan ini untuk semua pasangan siswa, plot mereka atau rangking mereka, dan selidiki rasio informasi terbesar untuk entropi.
Parameter tes dan kemampuan siswa tidak akan jatuh dari langit biru, tetapi mereka mudah diperkirakan dalam perangkat lunak modern seperti R dengan atau paket serupa:{c,bj,j=1,2,…} {ai}
lme4
atau sesuatu yang sangat dekat dengan ini.
sumber