Kekuatan penjelas suatu variabel

8

Saya memiliki model regresi linier sederhana. Yang ingin saya hitung adalah seberapa "penting" masing-masing variabel input saya yaitu membuat pernyataan seperti ini:

"60% daya prediksi dalam model ini berasal dari variabel var1, di mana var2 dan var3 memiliki masing-masing 30% dan 10%"

Apa yang perlu saya lakukan untuk menghitung persentase ini?

pengguna333
sumber
3
Apa tepatnya yang Anda maksud dengan "kekuatan prediksi"? Misalnya, var3 mungkin memiliki korelasi yang sangat tinggi dengan variabel dependen dalam sampel tetapi Anda mungkin perlu membuat prediksi di mana var3 menyimpang secara substansial dari nilai-nilai yang diperoleh dalam sampel, sehingga memperkenalkan ketidakpastian prediksi yang sangat besar. OTOH, var1 dan var2 secara individual mungkin memiliki korelasi buruk dengan DV, tetapi bersama-sama mungkin bekerja dengan baik untuk prediksi yang dimaksud. Ini menunjukkan bahwa mengukur "kekuatan prediksi" memerlukan konteks prediksi tertentu selain model.
whuber

Jawaban:

10

Paket relaimpo R melakukan apa yang ingin Anda lakukan, dan itu juga menyediakan bootstrap CI ketika menilai kontribusi relatif dari masing-masing prediktor terhadap keseluruhanR2.

Contoh penggunaan dapat ditemukan di akhir tutorial ini: Memulai dengan Pendekatan Modern untuk Regresi .

chl
sumber
+1 untuk jawaban mudah untuk melewatkan pertanyaan yang dirumuskan. Anda harus menambahkan bahwa ini hanya berfungsi jika jumlah prediktor lebih kecil dari, katakanlah, 50.
user603
@chl Hasil (= urutan pentingnya regressor) dari RelaImpo bervariasi secara drastis dari hasil nilai beta yang tidak standar. Saya bertanya-tanya mengapa itu - semua 14 regresi saya memiliki metrik yang sama (kisaran 0 - 3), dan meskipun rata-rata dan standar deviasi bervariasi secara drastis pada gejala, bobot beta yang tidak standar harus memberikan hasil yang kira-kira sama dari pada RelaImpo, atau tidak? Terima kasih.
Torvon