Saya berpikir untuk membangun model yang memprediksi rasio , di mana a ≤ b dan a > 0 dan b > 0 . Jadi, rasionya adalah antara 0 dan 1 .
Saya bisa menggunakan regresi linier, meskipun secara alami tidak membatasi ke 0..1. Saya tidak punya alasan untuk percaya bahwa hubungan itu linear, tetapi tentu saja itu sering digunakan, sebagai model pertama yang sederhana.
Saya bisa menggunakan regresi logistik, meskipun biasanya digunakan untuk memprediksi probabilitas hasil dua negara, bukan untuk memprediksi nilai kontinu dari kisaran 0..1.
Tidak tahu apa-apa lagi, apakah Anda akan menggunakan regresi linier, regresi logistik, atau opsi tersembunyi c ?
Jawaban:
Anda harus memilih "opsi tersembunyi c", di mana c adalah regresi beta. Ini adalah jenis model regresi yang sesuai ketika variabel respon didistribusikan sebagai Beta . Anda dapat menganggapnya sebagai analog dengan model linier umum . Persis seperti yang Anda cari. Ada paket yang
R
disebut betareg yang berurusan dengan ini. Saya tidak tahu apakah Anda menggunakannyaR
, tetapi meskipun Anda tidak bisa, Anda tetap bisa membaca 'sketsa', mereka akan memberi Anda informasi umum tentang topik tersebut selain cara menerapkannyaR
(yang tidak Anda perlukan di kasus itu).Kemungkinan lain adalah dengan menggunakan regresi linier jika rasio dapat diubah sehingga memenuhi asumsi model linear standar, meskipun saya tidak akan optimis tentang yang benar-benar berfungsi.
sumber
Apakah sampel berpasangan ini atau dua populasi independen?
Intersep Anda terhadap regresi ini akan berupa log (B) dan kemiringan Anda adalah log (rasio).
Lihat lebih lanjut di sini:
Beyene J, Moineddin R. Metode untuk estimasi interval kepercayaan parameter rasio dengan aplikasi untuk lokasi quotients. Metodologi penelitian medis BMC. 2005; 5 (1): 32.
EDIT: Saya telah menulis addon SPSS untuk melakukan hal ini. Saya dapat membagikannya jika Anda tertarik.
sumber
REGRESSION
setelah mengubah data. Sejak itu saya telah menulis versi yang lebih canggih yang digunakanGLM
. Saya berurusan dengan pengukuran emisi cahaya dan pengujian saya menyarankan regresi gamma dengan log-link adalah yang paling rentan terhadap ketidakpastian pada parameter. Untuk sebagian besar data saya yang sebenarnya, jawaban dari menggunakan normal, negatif-binomial, dan gamma dengan log-link semuanya sangat mirip (setidaknya dengan presisi yang saya butuhkan)sumber