Saya telah mengumpulkan data psikofisiologis yang mengukur kemampuan subyek (dua kelompok) untuk merasakan getaran. Probe bergetar bergerak melawan kulit pada perpindahan yang lebih kecil dan lebih kecil, dan subjek mengindikasikan kapan mereka merasakan getaran. Sayangnya, pada frekuensi tinggi, probe hanya bisa bergerak jarak pendek, dan kadang-kadang jarak terbesar yang bisa bergerak probe masih tidak cukup besar untuk dilihat oleh subjek. Jadi, saya memiliki nilai ambang batas yang akurat untuk beberapa mata pelajaran, tetapi bagi sebagian yang tidak pernah merasakan getaran, saya hanya memiliki nilai yang saya tahu ambangnya lebih besar daripada. Apakah ada cara bagi saya untuk tetap memasukkan data ini? Dan apa cara terbaik untuk menganalisanya?
12
Jawaban:
Saya suka menggunakan Model Campuran heterogen untuk menggambarkan efek gabungan dari sumber yang berbeda secara fundamental.
Anda mungkin melihat sesuatu seperti model "Zero Inflated Poisson" dalam gaya Diane Lambert. " Regresi Poisson Nol-Inflated, Dengan Aplikasi untuk Cacat dalam Manufaktur ", Diane Lambert, Technometrics, Vol. 34, Iss. 1, 1992
Saya menemukan ide ini sangat menyenangkan karena tampaknya bertentangan dengan anggapan bahwa penerapan desain statistik percobaan untuk pengobatan tidak dapat sepenuhnya menyembuhkan penyakit. Di balik gagasan tersebut terdapat gagasan bahwa metode ilmiah tidak dapat menyelesaikan tujuannya dalam kedokteran berasal dari gagasan bahwa tidak ada data penyakit dari individu yang sehat "sempurna" sehingga data tersebut tidak dapat memberi informasi mengenai pengobatan penyakit. Tanpa pengukuran tidak ada ruang untuk meningkatkan.
Menggunakan sesuatu seperti model zero-inflated memungkinkan seseorang untuk mengekstrak informasi berguna dari data yang sebagian "bebas kesalahan". Menggunakan wawasan ke dalam proses untuk mengambil informasi yang dapat dianggap sebagai "diam" dan membuatnya berbicara. Bagi saya ini adalah hal yang Anda coba lakukan.
Sekarang saya tidak bisa mulai menyatakan kombinasi model mana yang akan digunakan. Saya menduga Anda dapat menggunakan Gaussian Mixture Model (GMM) nol-inflasi untuk pemula. GMM adalah sedikit pendekatan universal empiris untuk PDF berkelanjutan - seperti sepupu PDF dari pendekatan Fourier Series, tetapi dengan dukungan teorema batas pusat untuk meningkatkan penerapan global dan memungkinkan banyak komponen yang lebih sedikit untuk membuat " bagus "aproksimasi.
Semoga berhasil.
EDIT:
Lebih lanjut tentang model tanpa inflasi:
sumber
Mengelompokkan hasil dan mendefinisikan skala mungkin menjadi solusi.
Buat variabel kategori seperti itu (atau berbeda):
Anda bisa menggunakan variabel ini untuk melakukan analisis, tetapi apakah hasilnya bermakna tergantung pada seberapa baik Anda mendefinisikan kategori.
sumber