Variabel skala sebagai data jumlah - benar atau tidak?

10

Dalam makalah ini (tersedia gratis melalui pusat PubMed), penulis menggunakan regresi binomial negatif untuk memodelkan skor pada instrumen skrining 10-item dengan skor 0-40. Prosedur ini mengasumsikan jumlah data, yang jelas tidak demikian di sini. Saya ingin pendapat Anda tentang apakah pendekatan ini dapat diterima, karena saya kadang-kadang menggunakan instrumen yang sama atau yang serupa dalam pekerjaan saya. Jika tidak, saya ingin tahu apakah ada alternatif yang dapat diterima. Lebih detail di bawah ini:

Skala yang digunakan adalah Tes Identifikasi Gangguan Penggunaan Alkohol (AUDIT), kuesioner 10-item yang dirancang sebagai instrumen skrining untuk gangguan penggunaan alkohol dan minum berbahaya / berbahaya. Instrumen diberi skor dari 0 hingga 40, dan hasilnya biasanya miring ke kiri.

Menurut pemahaman saya, menggunakan data jumlah mengasumsikan bahwa semua nilai yang "dihitung" tidak tergantung satu sama lain - pasien datang ke ruang gawat darurat setiap hari, jumlah kematian dalam kelompok tertentu, dll - mereka semua independen satu sama lain, meskipun tergantung pada variabel yang mendasarinya. Selain itu, saya pikir tidak mungkin ada jumlah maksimum yang diperbolehkan ketika menggunakan data jumlah, meskipun saya pikir asumsi ini dapat dilonggarkan ketika maksimum teoritis sangat tinggi jika dibandingkan dengan maksimum yang diamati dalam data?

Saat menggunakan skala AUDIT, kami tidak memiliki hitungan yang benar. Kami memiliki 10 item dengan skor total maksimum 40, meskipun skor tinggi jarang terlihat dalam praktik. Skor pada item secara alami berkorelasi satu sama lain.

Asumsi yang diperlukan untuk menggunakan data hitung dilanggar. Tetapi apakah ini masih merupakan pendekatan yang dapat diterima? Seberapa serius pelanggaran asumsi tersebut? Apakah ada keadaan tertentu di mana pendekatan ini dapat dianggap lebih dapat diterima? Apakah ada alternatif untuk pendekatan ini yang tidak melibatkan pengurangan variabel skala ke kategori?

JonB
sumber

Jawaban:

4

Instrumen AUDIT pada dasarnya adalah skala Likert. Serangkaian pertanyaan (item Likert), dengan jawaban sering pada skala lima poin, dirancang untuk mendapatkan beberapa fenomena mendasar. Jumlah tanggapan terhadap serangkaian pertanyaan, skala Likert, kemudian digunakan sebagai ukuran dari fenomena yang mendasarinya. Meskipun Likert item sering pada skala "sangat tidak setuju" untuk "sangat setuju," aplikasi untuk mengukur kecenderungan " A lcohol U se D isorders" dalam " Aku dentification T est" sangatlah mudah.

Sebagaimana dicatat dalam halaman Wikipedia skala Likert , "Apakah item Likert individu dapat dianggap sebagai data tingkat interval, atau apakah mereka harus diperlakukan sebagai data kategori-terurut adalah subjek ketidaksepakatan yang cukup dalam literatur, dengan keyakinan kuat tentang apa yang metode yang paling berlaku. " Perselisihan ini mungkin sudah ada sejak hampir 80 tahun sejak Likert pertama kali mengusulkan skala: apakah setiap langkah sepanjang skala itu setara, baik di dalam maupun di antara item yang membentuk skala? Masalah ini telah diatasi di Cross Validated, seperti dalam jawaban untuk pertanyaan ini , salah satu pertanyaan paling awal yang diajukan di situs ini.

Jika Anda menerima gagasan bahwa skala memiliki langkah-langkah yang seragam (atau cukup dekat dengan seragam untuk aplikasi yang sedang digunakan, mungkin dirata-rata dengan menambahkan 10 item berbeda, seperti dalam AUDIT), maka beberapa pendekatan untuk analisis dimungkinkan. Salah satunya adalah mempertimbangkan respons pada skala sebagai serangkaian langkah yang dipilih atau tidak dipilih untuk naik skala, dengan probabilitas yang sama untuk naik setiap langkah.

Hal ini memungkinkan seseorang untuk memikirkan " data skala Likert n-point sebagai percobaan dari proses binomial ," seperti dalam pertanyaan 2010 dari @MikeLawrence. Meskipun tanggapan terhadap pertanyaan itu tidak terlalu mendukung gagasan itu, tidak sulit untuk dengan cepat menemukan penelitian 2014 yang menggunakan dan memperluas pendekatan ini berhasil membedakan sub-populasi dengan kemungkinan binomial yang berbeda. Meskipun proses binomial sering digunakan untuk memodelkan data penghitungan, dengan demikian dapat digunakan untuk memodelkan jumlah, jumlah, langkah-langkah yang diambil seseorang dalam skala "Gangguan Penggunaan Alkohol."

Seperti yang dicatat @Scortchi dalam jawaban atas pertanyaan yang ditautkan dalam paragraf kedua, batasan dari model binomial adalah bahwa ia memaksakan hubungan tertentu antara rata-rata dan varians dari respons. The binomial negatif Menghapus bahwa pembatasan, dengan hilangnya interpretasi mudah disediakan oleh model binomial sederhana. Dalam analisis, parameter tambahan yang perlu disesuaikan hanya menggunakan satu tingkat kebebasan tambahan. Sebaliknya, mencoba menentukan probabilitas yang berbeda untuk masing-masing dari 40 langkah item-Likert dan jumlah mereka ke dalam skala Likert akan menakutkan.

Seperti @MatthewGraves mencatat dalam jawabannya untuk pertanyaan ini, apakah model binomial negatif yang tepat adalah yang terbaik dijawab dengan memeriksa residu. Dalam studi asli yang mengembangkan AUDIT, nilai 8 atau lebih pada skala 40 poin memiliki spesifisitas dan sensitivitas yang cukup masuk akal untuk membedakan mereka yang didiagnosis dengan "penggunaan alkohol berbahaya atau berbahaya," di 6 negara yang berbeda. Jadi mungkin model binomial dua populasi yang didasarkan pada populasi berisiko tinggi dan risiko rendah, mirip dengan studi 2014 yang dikaitkan di atas, akan lebih baik.

Mereka yang tertarik dengan AUDIT secara khusus harus memeriksa studi asli tersebut. Sebagai contoh, meskipun kebutuhan untuk minum pagi hari mungkin tampak untuk mengukur sesuatu yang sama sekali berbeda dari frekuensi minum, seperti dugaan @SeanEaster, minum pagi memiliki korelasi rata-rata tertimbang 0,73 dengan skala ukuran asupan alkohol. (Hasil itu tidak mengejutkan bagi seseorang yang memiliki teman dengan gangguan penggunaan alkohol.) AUDIT tampaknya menjadi contoh yang baik dari pertukaran yang diperlukan untuk mengembangkan instrumen yang dapat digunakan secara andal di berbagai budaya.

EdM
sumber
Terima kasih atas jawaban yang bagus. Ketika melihat data AUDIT saya sendiri lebih dari 20.000 individu bentuknya terlihat dekat dengan distribusi binomial negatif sehingga mungkin masuk akal untuk menggunakan asumsi distribusi, atau mungkin model quasi-poisson dapat digunakan? Jika kita menggunakan distribusi binomial dengan mempertimbangkan poin sebagai k berhasil dari 40 uji coba bernoulli, tidakkah kita akan memiliki masalah serius dengan penyebaran berlebihan? Terlihat seperti itu di data saya. Bisakah semi-binomial menjadi alternatif?
JonB
Banyak tergantung pada mengapa Anda memodelkan skor AUDIT 0-40 dan interpretasi heuristik apa yang ingin Anda tempatkan pada hasil. Jika semua yang Anda inginkan adalah hubungan skor AUDIT dengan variabel lain, dengan interpretasi terbatas dari nilai parameter distribusi itu sendiri, maka gunakan distribusi yang menyediakan residu yang berperilaku baik; saran Anda masuk akal. Memasukkan binomial tunggal ke data bermasalah, tetapi campuran 2 binomial (kelompok berisiko tinggi dan risiko rendah) dengan p yang berbeda mungkin informatif. Gunakan penilaian Anda berdasarkan pengetahuan Anda tentang materi pelajaran.
EdM
2

x=40x40

Sebagai komentar umum, rasa yang berbeda dari regresi memiliki prioritas yang berbeda untuk parameter (yaitu regularisasi) dan model kebisingan yang berbeda. Regresi kuadrat terkecil standar memiliki model noise Gaussian, regresi binomial negatif memiliki model noise binomial negatif, dan sebagainya. Tes sebenarnya apakah model regresi sesuai atau tidak adalah apakah residual noise memiliki distribusi yang diharapkan.

Jadi Anda dapat menerapkan regresi binomial negatif ke data Anda, menghitung residu, dan kemudian memplotnya pada plot probabilitas binomial negatif, dan mengetahui apakah model tersebut sesuai atau tidak. Jika noise terstruktur dengan cara lain, maka kita perlu mencari model noise yang cocok dengan struktur itu.

Penalaran dari model generatif ke struktur noise sangat membantu - jika kita tahu datanya multiplicative bukan additive, misalnya, kita meraih lognormal bukan normal - tetapi jika model generatif yang diharapkan dan struktur noise tidak setuju, pergi dengan data, bukan harapan.

Matthew Graves
sumber
Menarik, saya tidak tahu bahwa peristiwa itu bisa "menular". Apa yang Anda maksud dengan mengganti x = 40 dengan x> = 40, dalam praktiknya? Bagaimana saya melakukan plot probabilitas binomial negatif dalam R? Saya kira maksud Anda bukan plot residual terhadap nilai pas? Apakah maksud Anda seperti plot QQ?
JonB
@ JonB Misalkan Anda memiliki binomial negatif dengan r = 1 dan probabilitas keberhasilan p = .9. Probabilitas untuk selamat dari 40 percobaan tepatnya adalah 0,148%; probabilitas bertahan 40 percobaan atau lebih adalah 1,48%. Jadi seseorang dapat mendefinisikan probabilitas yang terbentuk dengan baik pada domain [0,40] dengan menggunakan binomial negatif untuk [0,39] dan kemudian mengatur [40] sehingga jumlahnya menjadi satu, yang karena distribusi binomial negatif baik- terbentuk adalah probabilitas bahwa itu 40 atau lebih.
Matthew Graves
@ JonB Tepat, maksud saya seperti plot QQ. Saya belum pernah melakukannya di R sebelumnya, tapi saya harap tautan ini akan membantu.
Matthew Graves
1
Saya melakukan percobaan pada beberapa data dengan skor AUDIT. Saat membuat plot qq, saya perlu membuat vektor acak hasil dari distribusi binomial negatif. Mu / theta diberikan oleh model regresi saya, tetapi bagaimana saya bisa tahu "ukuran" apa yang digunakan? Maaf jika ini adalah pertanyaan khusus-R .. Pokoknya, apakah Anda memiliki referensi bagus yang dapat saya baca lebih lanjut tentang penerapan binomial negatif (dan distribusi lainnya) untuk jenis skala yang dibangun dengan menjumlahkan beberapa item yang mengukur jenis dari proses yang sama?
JonB
Saya melakukan beberapa percobaan tambahan sekarang. Saya mensimulasikan dataset dengan dua variabel: x dan y. 50% adalah x = 0, 50% adalah x = 1. Mereka yang x = 0 memiliki probabilitas 0,2 untuk y = 1, dan mereka yang x = 1 memiliki probabilitas 0,4 untuk y = 1. Saya kemudian menjalankan regresi logistik dan melihat residunya. Tidak terlihat didistribusikan secara biner sama sekali. Bahkan, mereka (tentu saja) mengambil 4 nilai spesifik. Apakah Anda yakin bahwa pola residual harus selalu sesuai dengan asumsi distribusi? Karena dalam contoh ini, itu jelas salah.
JonB