Saya memiliki 100 pasien dan setiap pasien memiliki 10 pengukuran kreatinin serum longitudinal. Perkiraan laju filtrasi glomerulus (eGFR) dihitung dari formula MDRD yang terdiri dari jenis kelamin, usia, dan kreatinin serum. eGFR adalah variabel dependen dan waktu adalah variabel independen dalam regresi linier untuk setiap pasien.
- Apakah regresi linier melanggar asumsi "X independen" dan model campuran linier harus digunakan sebagai gantinya?
- Dapatkah lereng eGFR (yang merupakan estimasi dengan ketidakpastian alih-alih angka yang diukur) diperkirakan dari setiap pasien (dalam regresi linier untuk setiap pasien atau dalam model campuran efek acak [bagaimana memperkirakan lereng untuk setiap pasien individu dalam model campuran?]) Digunakan sebagai variabel independen atau dependen dalam model regresi lainnya?
Terima kasih.
regression
mixed-model
repeated-measures
panel-data
Jin-Yuh Guh
sumber
sumber
Jawaban:
Akibatnya, Anda mengusulkan untuk menggunakan regresi linier sebagai prosedur matematis untuk menyingkat pengamatan 10-variate menjadi variabel tunggal (kemiringan). Dengan demikian itu hanyalah contoh lain dari prosedur serupa seperti (katakanlah) menggunakan rata-rata pengukuran berulang sebagai variabel regresi atau termasuk skor komponen utama dalam regresi.
Ikuti komentar spesifik.
(1) Regresi linier tidak mengharuskan X (variabel independen) untuk menjadi "independen." Memang, dalam perumusan standar konsep kemerdekaan bahkan tidak berlaku karena X adalah nilai tetap, bukan realisasi dari variabel acak.
(2) Ya, Anda dapat menggunakan lereng sebagai variabel dependen . Ini akan membantu untuk menetapkan bahwa mereka mungkin berperilaku seperti variabel dependen dalam regresi linier. Untuk kuadrat terkecil biasa ini artinya
Sebuah. Lereng mungkin tergantung pada beberapa atribut pasien.
b. Ketergantungan sekitar linear, setidaknya untuk rentang atribut pasien yang diamati.
c. Setiap variasi antara lereng yang diamati dan lereng yang dihipotesiskan dapat dianggap acak.
d. Variasi acak ini adalah (i) independen dari pasien ke pasien dan (ii) memiliki distribusi yang kira-kira sama dari pasien ke pasien.
e. Seperti sebelumnya, variabel independen tidak dipandang sebagai acak tetapi tetap dan diukur tanpa kesalahan yang cukup besar.
Jika semua kondisi ini kira-kira bertahan, Anda harusnya ok. Pelanggaran (d) atau (e) dapat disembuhkan dengan menggunakan generalisasi kuadrat terkecil biasa.
(2 '). Karena lereng akan menunjukkan ketidakpastian (yang diukur dalam regresi yang digunakan untuk memperkirakan lereng), lereng tersebut mungkin bukan kandidat yang baik untuk variabel independen kecuali Anda memperlakukannya secara acak dalam model campuran atau menggunakan model kesalahan-dalam-variabel.
Anda juga dapat mengatasi situasi ini dengan menggunakan model Bayes hierarkis .
sumber