Saya mencari penjelasan 1) mekanis dan 2) intuitif untuk bagaimana efek dari variabel individu ditentukan memegang variabel lain konstan.
Dalam contoh menggunakan data survei, apa sebenarnya artinya mengatakan:
"Dengan usia, jenis kelamin, dan penghasilan yang konstan, pengaruh pendidikan adalah ___"
Pemahaman saya adalah bahwa dengan regresi kami berusaha untuk menciptakan kembali pengaturan eksperimental, dan dalam contoh di atas mencoba untuk membandingkan sub-populasi dengan usia, jenis kelamin, pendapatan, dll yang sama, tetapi dengan tingkat pendidikan yang berbeda, dan memperkirakan perbedaan dalam berarti dari subpopulasi tersebut. Pertanyaan:
- Apakah intuisi ini benar?
- Apakah subpopulasi ini tentu ada? Bagaimana jika survei tidak mengandung responden dengan nilai yang persis sama pada kontrol?
- Bagaimana ketidakpastian tentang perkiraan subpopulasi ini ditentukan?
regression
interpretation
FlacoT
sumber
sumber
Jawaban:
Intuisi adalah subjek yang rumit, tergantung pada latar belakang orang tersebut. Sebagai contoh, saya belajar statistik setelah mempelajari fisika matematika. Bagi saya intuisi adalah turunan parsial. Pertimbangkan model regresi
Ambil turunan total dari fungsif( ) :
Ini adalah bagaimana turunan parsial wrtx didefinisikan:
Dengan kata lain, dalam model linier sederhana koefisien Anda adalah turunan parsial (kemiringan) berkaitan dengan variabel. Itulah arti "memegang konstan" bagi saya secara intuitif.
sumber
sumber
Ketika user122677 menjawab, intuisi itu benar: Dalam regresi linier, setiap koefisien adalah jumlah perubahan dalam hasil ketika satu nilai variabel ditingkatkan oleh satu unit sementara semua variabel lainnya tetap konstan. Dengan kata lain, koefisien adalah turunan parsial dari prediksi model terhadap masing-masing variabel.
Bagaimanapun, berhati-hatilah bahwa jika model kita memasukkan variabel interaksi tidak dapat diubah tanpa mengubah interaksi dan karenanya interpretasi satu koefisien ini tidak masuk akal sebagai perubahan nyata. Hal yang sama terjadi dengan regresi polinomial, di mana tidak ada istilah yang dapat berubah tanpa mengubah istilah lainnya.
Tentang keberadaan sub-populasi itu, mereka tidak perlu ada. Dalam beberapa desain eksperimental mereka bisa ada, tetapi dalam studi observasional dengan variabel kontinu mereka sangat tidak mungkin ada. Sebagai contoh:
sumber