Apa arti "semua sama dengan" dalam regresi berganda?

22

Ketika kita melakukan beberapa regresi dan mengatakan kita sedang melihat perubahan rata-rata dalam variabel untuk perubahan dalam variabel , mempertahankan semua variabel lain konstan, nilai apa yang kita pegang pada variabel lain konstan? Maksud mereka? Nol? Ada nilai?yx

Saya cenderung berpikir itu ada nilainya; hanya mencari klarifikasi. Jika ada yang punya bukti, itu akan bagus juga.

EconStats
sumber
2
Saya menemukan contoh 10 dalam makalah Peter Kennedy yang sangat membantu dalam memahami hal ini.
Dimitriy V. Masterov
Ya, sedikit tentang meningkatkan jumlah kamar sambil menjaga kaki persegi konstan adalah titik yang benar-benar jeli. Makalah itu sebenarnya adalah tambang emas dari ide-ide berguna, itu masuk dalam catatan PhD.
EconStats
1
Ini sebenarnya pertanyaan yang sangat menarik, saya bertanya-tanya apakah para ekonom bertanya pada diri sendiri apa arti "ceteris paribus".
mugen

Jawaban:

26

Kamu benar. Secara teknis, itu adalah nilai apa pun . Namun, ketika saya mengajarkan ini, saya biasanya memberi tahu orang-orang bahwa Anda mendapatkan efek perubahan satu unit dalam ketika semua variabel lain diadakan pada masing-masing cara. Saya percaya ini adalah cara umum untuk menjelaskannya yang tidak spesifik untuk saya. Xj

Saya biasanya melanjutkan dengan menyebutkan bahwa jika Anda tidak memiliki interaksi apa pun, akan menjadi efek dari perubahan satu unit dalam , tidak peduli apa nilai dari variabel Anda yang lain. Tapi saya suka memulai dengan formulasi yang berarti. Alasannya adalah bahwa ada dua efek termasuk beberapa variabel dalam model regresi. Pertama, Anda mendapatkan efek mengendalikan variabel lain (lihat jawaban saya di sini ). Yang kedua adalah bahwa kehadiran variabel lain (biasanya) mengurangi varians residual dari model, membuat variabel Anda (termasukX j X j X j XβjXjXjXj) 'lebih signifikan'. Sulit bagi orang untuk memahami bagaimana ini bekerja jika variabel lain memiliki nilai yang ada di semua tempat. Sepertinya itu akan meningkatkan variabilitas entah bagaimana. Jika Anda berpikir untuk menyesuaikan setiap titik data ke atas atau ke bawah untuk nilai masing-masing variabel lain hingga semua variabel dipindahkan ke masing-masing artinya, lebih mudah untuk melihat bahwa variabilitas residual telah berkurang. X

Saya tidak bisa berinteraksi sampai satu atau dua kelas setelah saya memperkenalkan dasar-dasar regresi berganda. Namun, ketika saya sampai pada mereka, saya kembali ke materi ini. Hal di atas berlaku ketika tidak ada interaksi. Ketika ada interaksi, itu lebih rumit. Dalam hal ini, variabel yang berinteraksi [s] dipertahankan konstan (sangat spesifik) pada , dan tanpa nilai lainnya. 0

Jika Anda ingin melihat bagaimana ini dimainkan secara aljabar, itu agak mudah. Kita bisa mulai dengan kasus tanpa interaksi. Mari kita tentukan perubahan pada ketika semua variabel lain dipertahankan konstan pada masing-masing artinya. Tanpa kehilangan keumuman, katakanlah ada tiga variabel dan kami tertarik untuk memahami bagaimana perubahan dalam dikaitkan dengan perubahan satu unit di , memegang dan konstan pada masing-masing artinya: X Y X3X1X2Y^XY^X3X1X2

Y^saya=β^0+β^1X¯1+β^2X¯2+β^3X3sayaY^saya=β^0+β^1X¯1+β^2X¯2+β^3(X3saya+1) kurangi persamaan pertama dari persamaan kedua: Y^saya-Y^saya=β^0-β^0+β^1X¯1-β^1X¯1+β^2X¯2-β^2X¯2+β^3(X3saya+1)-β^3X3sayaΔY=β^3X3saya+β^3-β^3X3sayaΔY=β^3

Sekarang jelas bahwa kami dapat memberikan nilai apa pun untuk dan dalam dua persamaan pertama, selama kami memberikan nilai yang sama untuk ( ) di keduanya. Yaitu, selama kita memegang dan konstan . X 2 X 1 X 2 X 1 X 2X1X2X1X2X1X2

Di sisi lain, itu tidak berfungsi seperti ini jika Anda berinteraksi. Di sini saya menunjukkan kasus di mana ada istilah interaksi : X1X3

Y^i=β^0+β^1X¯1+β^2X¯2+β^3X3i +β^4X¯1X3iY^i=β^0+β^1X¯1+β^2X¯2+β^3(X3i+1)+β^4X¯1(X3i+1) subtracting the first equation from the second: Y^iY^i=β^0β^0+β^1X¯1β^1X¯1+β^2X¯2-β^2X¯2+β^3(X3saya+1)-β^3X3saya+ β^4X¯1(X3saya+1)-β^4X¯1X3sayaΔY=β^3X3saya+β^3-β^3X3saya+β^4X¯1X3saya+β^4X¯1-β^4X¯1X3sayaΔY=β^3+β^4X¯1

Dalam hal ini, tidak mungkin untuk mempertahankan semua yang lain konstan. Karena istilah interaksi adalah fungsi dari dan , tidak mungkin untuk mengubah tanpa istilah interaksi berubah juga. Dengan demikian, sama dengan perubahan terkait dengan perubahan satu unit di hanya ketika variabel yang berinteraksi ( ) disimpan pada bukannya (atau nilai lain selain ), dalam hal ini istilah terakhir dalam persamaan bawah keluar. X 3 X 3 β 3 Y X 3 X 1 0 ˉ X 1 0X1X3X3β^3Y^X3 X10X¯10

Dalam diskusi ini, saya telah berfokus pada interaksi, tetapi lebih umum, masalahnya adalah ketika ada variabel yang merupakan fungsi dari yang lain sehingga tidak mungkin untuk mengubah nilai yang pertama tanpa mengubah nilai masing-masing dari variabel lain . Dalam kasus seperti itu, arti menjadi lebih rumit. Misalnya, jika Anda memiliki model dengan dan , maka adalah turunan memegang semua yang lain sama, dan memegang (lihat jawaban saya di sini ). Selain itu, formulasi yang lebih rumit juga dimungkinkan. XjX 2 j β jdYβ^jXjXj2β^j Xj=0dYdXjXj=0

gung - Reinstate Monica
sumber
1
Terima kasih gung, jawaban ini bagus untuk beberapa level. Pertama itu menjawab poin utama saya tertarik. Kedua, Anda memperkirakan apa pertanyaan tindak lanjut saya akan, karena saya akan bertanya bagaimana ini berubah dengan diperkenalkannya istilah interaksi. Terima kasih untuk matematika juga. Saya tahu pertanyaan ini agak mendasar tetapi saya merasa Anda tidak akan pernah terlalu eksplisit dengan konsep-konsep ini.
EconStats
Sama-sama, @EconStats. Tidak ada masalah dengan memasukkan matematika, kadang-kadang membuatnya lebih mudah untuk memahami apa yang sedang terjadi.
gung - Reinstate Monica
Yah saya harus mengatakan bahwa ketika Anda mengurangi persamaan pertama dari persamaan kedua akhirnya dikonfirmasi pikiran asli saya bahwa tidak masalah apa nilai dan , asalkan sama di kedua persamaan. Tampaknya sangat jelas bagi saya untuk mengetahui, tetapi saya tidak pernah berpikir untuk menghitung seperti itu sebelumnya. Saat bola lampu yang pasti bagi saya. X 3 βX2X3β
EconStats
Anda juga dapat mengambil turunan wrt dan itu akan membawa Anda ke tempat yang sama, tetapi ini adalah matematika yang lebih mudah (pada dasarnya aljabar sekolah menengah), sehingga akan dapat diakses oleh audiens yang lebih luas. X jYXj
gung - Reinstate Monica
1
@ Beetroot, jika saya mengerti Anda dengan benar, Anda cukup memegangnya pada level yang ditentukan. (Kalau tidak, Anda mungkin mengajukan ini sebagai pertanyaan baru.)
gung - Reinstate Monica
8

Matematikanya sederhana, ambil saja perbedaan antara 2 model dengan salah satu variabel x yang diubah oleh 1 dan Anda akan melihat bahwa tidak masalah apa variabel-variabel lainnya (mengingat tidak ada interaksi, polinomial, atau istilah rumit lainnya).

Satu contoh:

y[1]=b0+b1×x1+b2×x2

y[2]=b0+b1×(x1+1)+b2×x2

y[2]-y[1]=b0-b0+b1×x1-b1×x1+b1×1+b2×x2-b2×x2=b1

Greg Snow
sumber
6

Saya yakin Anda mengacu pada ketergantungan pada kovariat ( ). Jadi jika modelnya adalah efek pada semua hal lain dianggap sama akan menjadi untuk dengan semua lainnya tetap konstan pada nilai berapa pun. Y = β 0 + β 1 X 1 + β 2 X 2 X i Y Δ YXsaya

Y=β0+β1X1+β2X2
XsayaY ΔXiXjΔYΔXsayaΔXsayaXj

Ingatlah bahwa mungkin dan bergantung (mis. Fungsi satu sama lain) tanpa harus menunjukkan interaksi yang signifikan dalam model linier ( di ).X 2 β 12 = 0 Y = β 0 + β 1 X 1 + β 2 X 2 + β 12 X 1 X 2X1X2β12=0Y=β0+β1X1+β2X2+β12X1X2

Sama seperti garis singgung yang menarik di sini adalah contohnya: Biarkan dan maka jelas setiap perubahan dalam akan mempengaruhi . Namun kovarians di antara keduanya adalah nol. X 2 = X 2 1 + N ( 0 , σ 2 2 ) X 1 X 2 c o v ( X 1 , X 2 ) = E ( X 1 X 2 ) - E ( X 1 ) E ( X 2 ) = EX1N(0,σ12)X2=X12+N(0,σ22)X1X2

cHaiv(X1,X2)=E(X1X2)-E(X1)E(X2)
=E[X1(X12+Sebuah)]-E(X1).E(X12-Sebuah)wsayathSebuahN(0,σ22)
=E(X13)-E(X1.Sebuah)-0.E(X12-Sebuah)=0-0-0=0

Jadi dalam kenyataannya perubahan dalam akan dikaitkan dengan perubahan dalam dan bahwa tidak akan mencakup apa yang sebenarnya akan terjadi jika Anda mengubah . Tetapi masih akan digambarkan sebagai efek pada semua hal dianggap sama.X1X2ΔYΔXsayaX1ΔYΔXsayaXsayaY

Ini sebanding dengan perbedaan antara turunan penuh dan turunan parsial (analog dari ) dalam persamaan diferensial. ΔYΔXsaya

Hans Roggeman
sumber
Terima kasih Hans, saya benar-benar mencoba untuk mendapatkan pada titik yang dibuat gung tetapi ini adalah contoh yang baik ketika kedua variabel tergantung.
EconStats