Ini pertanyaan statistik sederhana yang saya terima. Saya tidak begitu yakin saya memahaminya.
X = jumlah poin yang diperoleh dalam ujian (pilihan ganda dan jawaban yang benar adalah satu poin). Apakah X binomial didistribusikan?
Jawaban profesor adalah:
Ya, karena hanya ada jawaban benar atau salah.
Jawabanku:
Tidak, karena setiap pertanyaan memiliki "probabilitas-sukses" yang berbeda p. Seperti yang saya pahami, distribusi binomial hanyalah serangkaian eksperimen Bernoulli, yang masing-masing memiliki hasil sederhana (sukses atau gagal) dengan p keberhasilan-probabilitas yang diberikan (dan semuanya "identik" tentang p). Misalnya, membalik koin (adil) 100 kali, ini adalah 100 eksperimen Bernoulli dan semuanya memiliki p = 0,5. Tapi di sini pertanyaannya punya berbagai jenis kan?
sumber
Jawaban:
Saya setuju dengan jawaban Anda. Biasanya data seperti ini saat ini akan dimodelkan dengan semacam model Item Response Theory . Misalnya, jika Anda menggunakan model Rasch , maka jawaban biner akan dimodelkan sebagaiXdan aku
di mana dapat dianggap sebagai kemampuan orang ke- dan sebagai kesulitan ke- . Jadi model ini memungkinkan Anda untuk menangkap fakta bahwa orang yang berbeda memiliki kemampuan dan pertanyaan yang berbeda-beda dalam kesulitan, dan ini adalah yang paling sederhana dari model IRT. n δ i iβn n δsaya saya
Profesor jawaban Anda mengasumsikan bahwa semua pertanyaan memiliki probabilitas yang sama "sukses" dan independen, karena binomial adalah distribusi dari jumlah IID percobaan Bernoulli. Ini mengabaikan dua jenis dependensi yang dijelaskan di atas.n
Seperti yang diperhatikan dalam komentar, jika Anda melihat distribusi jawaban dari orang tertentu (jadi Anda tidak perlu peduli dengan variabilitas antar-orang), atau jawaban dari orang yang berbeda pada item yang sama (sehingga tidak ada antara- variabilitas item), maka distribusi akan menjadi Poisson-binomial, yaitu distribusi jumlah dari percobaan Bernoulli non-iid. Distribusi dapat diperkirakan dengan binomial, atau Poisson, tetapi itu saja. Kalau tidak, Anda membuat asumsi id.n
Bahkan di bawah asumsi "nol" tentang menebak, ini mengasumsikan bahwa tidak ada pola menebak, sehingga orang tidak berbeda dalam bagaimana mereka menebak dan item tidak berbeda dalam bagaimana mereka menebak - sehingga menebak itu murni acak.
sumber
Jawaban untuk masalah ini tergantung pada pembingkaian pertanyaan dan kapan informasi diperoleh. Secara keseluruhan, saya cenderung setuju dengan profesor tetapi berpikir penjelasan jawabannya kurang baik dan pertanyaan profesor harus mencakup lebih banyak informasi di muka.
Jika Anda mempertimbangkan jumlah pertanyaan ujian potensial yang tak terbatas, dan Anda menggambar satu secara acak untuk pertanyaan 1, menggambar satu secara acak untuk pertanyaan 2, dll. Lalu pergi ke ujian:
Di bawah kerangka kerja ini, asumsi percobaan binomial terpenuhi.
Sayangnya, masalah statistik yang diusulkan dengan buruk sangat umum dalam praktik, tidak hanya pada ujian. Saya tidak akan ragu untuk mempertahankan alasan Anda kepada profesor Anda.
sumber
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.
- Saya pikir Anda harus membuat secara eksplisit asumsi bahwa pertanyaan ujian diambil secara independen dari kumpulan pertanyaan potensial. Akan lebih realistis bagi mereka untuk dikorelasikan: jika pertanyaan 1 mudah, kemungkinan Anda akan diberikan ujian yang mudah dan pertanyaan 2 akan mudah.Jika ada n pertanyaan, dan saya dapat menjawab satu pertanyaan dengan benar dengan probabilitas p, dan ada cukup waktu untuk mencoba menjawab semua pertanyaan, dan saya melakukan 100 tes ini, maka skor saya akan terdistribusi normal dengan rata-rata np.
Tapi ini bukan saya mengulangi tes 100 kali, itu 100 kandidat berbeda melakukan satu tes, masing-masing dengan probabilitas sendiri p. Distribusi p ini akan menjadi faktor utama. Anda mungkin memiliki tes di mana p = 0,9 jika Anda mempelajari subjek dengan baik, p = 0,1 jika Anda tidak, dengan sangat sedikit orang antara 0,1 dan 0,9. Distribusi titik akan memiliki maksimum yang sangat kuat pada 0,1 n dan 0,9 n dan tidak akan mendekati distribusi normal.
Di sisi lain, ada tes di mana setiap orang dapat menjawab pertanyaan apa pun, tetapi mengambil jumlah waktu yang berbeda, sehingga beberapa akan menjawab semua pertanyaan, dan yang lain akan menjawab lebih sedikit karena mereka kehabisan waktu. Jika kita dapat mengasumsikan bahwa kecepatan kandidat terdistribusi normal, maka poin akan mendekati terdistribusi normal.
Tetapi banyak tes akan berisi beberapa pertanyaan yang sangat sulit dan sangat mudah, sengaja sehingga kita dapat membedakan antara kandidat terbaik (yang akan menjawab semua pertanyaan hingga tingkat kesulitan tertentu) dan kandidat terburuk (yang hanya akan mampu menjawab sangat pertanyaan sederhana). Ini akan mengubah distribusi poin dengan cukup kuat.
sumber
Menurut definisi, distribusi binomial adalah seperangkat independen dan terdistribusi secara identik percobaan Bernoulli. Dalam kasus ujian pilihan ganda, masing-masing dari pertanyaan akan menjadi salah satu uji coba Bernoulli.nn n
Masalah di sini muncul karena kita tidak dapat mengasumsikan bahwa mempertanyakan:n
Saya telah melihat pertanyaan di kelas Statistik yang memodelkan pertanyaan ujian sebagai binomial, tetapi mereka membingkai sesuatu seperti:
Dalam skenario ini, tentu saja itu akan direpresentasikan sebagai distribusi binomial dengan .p = 14
sumber