Saya melakukan regresi linier berganda. Saya memiliki 21 pengamatan dan 5 variabel. Tujuan saya hanya menemukan hubungan antar variabel
- Apakah data saya cukup untuk melakukan regresi berganda?
Hasil uji-t mengungkapkan 3 variabel saya tidak signifikan. Apakah saya perlu melakukan regresi lagi dengan variabel signifikan (atau regresi pertama saya cukup untuk mendapatkan kesimpulan)? Matriks korelasi saya adalah sebagai berikut
var 1 var 2 var 3 var 4 var 5 Y var 1 1.0 0.0 0.0 -0.1 -0.3 -0.2 var 2 0.0 1.0 0.4 0.3 -0.4 -0.4 var 3 0.0 0.4 1.0 0.7 -0.7 -0.6 var 4 -0.1 0.3 0.7 1.0 -0.7 -0.9 var 5 -0.3 -0.4 -0.7 -0.7 1.0 0.8 Y -0.2 -0.4 -0.6 -0.9 0.8 1.0
var 1 dan var 2 adalah variabel kontinu dan var 3 sampai 5 adalah variabel kategori dan y adalah variabel dependen saya.
Seharusnya disebutkan variabel penting yang telah dipertimbangkan dalam literatur sebagai faktor yang paling berpengaruh pada variabel dependen saya tidak juga di antara variabel regresi saya karena keterbatasan data saya. Apakah masih masuk akal untuk melakukan regresi tanpa variabel penting ini?
inilah interval kepercayaan diri saya
Varibales Regression Coefficient Lower 95% C.L. Upper 95% C.L.
Intercept 53.61 38.46 68.76
var 1 -0.39 -0.97 0.19
var 2 -0.01 -0.03 0.01
var 3 5.28 -2.28 12.84
var 4 -27.65 -37.04 -18.26
**var 5 11.52 0.90 22.15**
Jawaban untuk pertanyaan umum adalah bahwa itu tergantung dari banyak faktor dengan yang utama adalah (1) jumlah kovariat (2) varians dari estimasi dan residu. Dengan sampel kecil Anda tidak memiliki banyak kekuatan untuk mendeteksi perbedaan dari 0. Jadi saya akan melihat varians estimasi dari parameter regresi. Dari pengalaman saya dengan regresi 21 pengamatan dengan 5 variabel tidak cukup data untuk menyingkirkan variabel. Jadi saya tidak akan terlalu cepat untuk membuang variabel atau terlalu terpikat dengan yang terlihat signifikan. Jawaban terbaik adalah menunggu sampai Anda memiliki lebih banyak data. Terkadang itu mudah diucapkan tetapi sulit dilakukan. Saya akan melihat regresi bertahap, maju dan mundur hanya untuk melihat variabel apa yang dipilih. Jika kovariat sangat berkorelasi ini dapat menunjukkan set variabel yang sangat berbeda yang dipilih. Bootstrap prosedur pemilihan model yang akan mengungkapkan sensitivitas pemilihan variabel terhadap perubahan data. Anda harus menghitung matriks korelasi untuk kovariat. Mungkin Frank Harrell akan ikut campur dalam hal ini. Dia benar-benar ahli dalam pemilihan variabel. Saya pikir dia setidaknya akan setuju dengan saya bahwa Anda tidak harus memilih model akhir hanya berdasarkan 21 poin data ini.
sumber