Ekonometrika: Apakah elastisitas bermakna dalam regresi saya, atau apa pun,?

13

Beberapa bulan yang lalu saya magang di organisasi ini; dan, sebagai hadiah pergi, saya memutuskan untuk menghabiskan minggu terakhir saya, dengan waktu luang apa pun yang saya miliki, untuk menyelidiki faktor-faktor yang mempengaruhi gaji guru. Satu masalah yang saya hadapi dengan gaji guru adalah bahwa distribusi untuk kondisi yang diberikan miring. Saya memiliki banyak pengamatan yang melekat pada ujung bawah dari spektrum upah. Saya mencoba menyelesaikan ini dengan memasukkan Indeks Upah Sebanding ke dalam variabel dependen saya (upah guru), tetapi hasil yang saya temukan benar-benar ketinggalan zaman untuk ruang lingkup proyek saya. Saya malah memutuskan untuk mencatat variabel dependen saya. Ini bagus karena sekarang upah saya memiliki distribusi normal dan terlihat sempurna dalam histogram. Ketika saya mulai menguji, saya sampai pada titik di mana saya ditinggalkan dengan satu variabel independen terakhir, pengembalian pajak properti. Masalah dengan upah normatif saya juga terlihat dalam pengamatan pengembalian pajak properti saya. Saya memiliki kecenderungan besar pada angka pengembalian pajak properti ke bagian bawah spektrum. Jadi, saya mencatat variabel ini juga dan masih lulus uji hipotesis nol.

Saya tidak yakin apakah ini benar, tetapi dengan membandingkan perubahan dari satu variabel log ke variabel log lainnya memberi saya elastisitas. Dengan asumsi bahwa ini benar, persamaan regresi saya (sesuatu seperti LogWages = B0 + B1 (LogPropertyTaxReturns)) menunjukkan elastisitas antara dua variabel. Apakah ini bermakna? Jika tujuan saya adalah untuk melihat variabel mana yang paling mempengaruhi gaji guru di negara bagian saya, maka apakah elastisitas antara kedua variabel itu membantu? Kami ingin menaikkan kabupaten dengan gaji guru terendah lebih tinggi untuk meningkatkan standar hidup mereka, tetapi saya khawatir saya telah memperkirakan jauh dari pengamatan nyata bahwa persamaan regresi kesimpulan saya tidak ada artinya.

Sunting: Salah satu ketakutan saya yang lebih besar adalah bahwa saya seharusnya menggunakan model non-linear untuk menunjukkan hubungannya. Saya merasa bahwa memaksa baik variabel dependen dan independen untuk bekerja sama dalam regresi linier ini menyesatkan dalam beberapa cara.

rosenjcb
sumber
1
Ini sangat berarti. Lihatlah definisi elastisitasnya. Anda pada dasarnya memiliki informasi tentang arah hubungan antara Upah dan PropertyTaxReturns. Selain itu, Anda memiliki perkiraan ukuran hubungan itu. Karena ini adalah Log-Log, upah akan berubah sebesar B1 persen per satu persen perubahan dari pengembalian pajak properti. Anda dapat melakukan analisis deret waktu untuk mengonfirmasinya. Sebenarnya, hanya grafik upah dan pengembalian pajak properti dari waktu ke waktu akan cukup untuk melihat apa hubungannya. Itulah cara dasar yang tidak memperhitungkan variabel tersembunyi dan lain
Koba
@Koba Terima kasih telah berkomentar begitu cepat. Bukankah masalahnya meskipun elastisitas itu berubah sepanjang kurva? Penyesalan terbesar saya adalah bahwa saya mungkin telah memaksa model menjadi linier, memaksa elastisitasnya menjadi cukup stabil. Memikirkan kembali, mungkin sebenarnya lebih baik untuk memiliki model non-linear untuk mencerminkan kecenderungan ini yang saya bicarakan.
rosenjcb
Tidak ada yang salah dalam mentransformasikan variabel menggunakan log, root kuadrat, timbal balik, atau metode lain. Anda tidak memaksa apa pun. Anda menggunakan transformasi untuk menemukan hubungan linier antara variabel. Terkadang mudah seperti Anda hanya menggunakan y = b0 + b1 * x. Variabel lain kali berhubungan secara linear dengan cara yang lebih rumit seperti misalnya log (y) = b0 + b1 * (1 / x). Fungsi terakhir mungkin memberi Anda hubungan linier yang baik, tetapi lebih sulit untuk ditafsirkan, jadi semakin sedikit transformasi yang Anda gunakan, semakin baik.
Koba
Fungsi log-log adalah log yang cukup mudah (y) = b0 + b1 * log (x). B1 adalah persen perubahan dalam y per satu persen perubahan dalam x dalam analisis cross-section Anda. Sekali lagi, jika Anda memiliki data ini untuk jangka waktu tertentu, Anda cukup membuat grafiknya untuk melihat hubungannya.
Koba
Saya telah mencatat variabel sebelumnya dan melakukan transformasi lain untuk model regresi saya. Saya hanya khawatir elastisitas memberi alasan pertemuan. Meskipun, jika dipikir-pikir, modelnya linear, ia hanya memiliki masalah memiliki variabel dependen dan independen dengan distribusi yang miring.
rosenjcb

Jawaban:

12

Jawaban atas pertanyaannya adalah ya, itu memang bermakna (setidaknya secara matematis). Jika Anda memperkirakan persamaan linier

W=β0+β1PTR,

maka , yang berarti bahwaβ1mewakili perubahan marjinalPTRlebihW. Sekarang, jika Anda memperkirakanβ1=WPTRβ1PTRW

lHaig(W)=β0+β1lHaig(PTR),

maka , yang merupakan definisi elastisitas.β1=WPTRPTRW

Secara umum, transformasi linear hanya memengaruhi interpretasi yang diberikan kepada koefisien, tetapi validitas regresi itu sendiri (dalam istilah ekonomi luas) diberikan oleh asumsi model dan fenomena ekonomi yang dianalisis.

han-tyumi
sumber
8

Y=αXβdalamY=dalamα+βdalamX

Saya kira pertanyaan Anda adalah apakah menggunakan bentuk fungsional ini masuk akal atau tidak dalam model khusus Anda. Sulit dikatakan. Seperti halnya regresi linier biasa, Anda membuat asumsi tentang bentuk fungsional. Anda setidaknya bisa menganggapnya sebagai pendekatan linier yang lebih masuk akal setelah transformasi log-log.

jmbejara
sumber
7

xαβF

catatanysaya=α+βcatatanxsaya+j=2Sγjχj+λjχjcatatanxsaya
χjγλ

Perhatikan bahwa sebagai representasi dari keputusan mendasar yang "benar" membuat semua transformasi yang menghasilkan regresi linier adalah salah. Faktanya, semua model akan salah. Pertanyaannya adalah: apakah statistik yang Anda peroleh dari model ini bermanfaat untuk masalah Anda ? Jika studi Anda difokuskan pada penentuan model yang mendasarinya, apakah ini momen yang memberi tahu Anda sesuatu yang menarik tentang model yang lebih dalam itu? Jika Anda lebih berorientasi pada kebijakan, akankah perkiraan dengan elastisitas konstan membuat Anda cukup dekat dengan kebenaran bahwa perbaikan lebih lanjut tidak relevan? Keduanya adalah pertanyaan yang sangat sulit dijawab sebagai pengamat luar. Tetapi jika satu-satunya alternatif yang Anda khawatirkan adalah elastisitas variabel, jenis tes yang saya uraikan di atas dapat memberi Anda ketenangan pikiran.

jayk
sumber
4

Jawaban lain mencakup masalah utama, saya ingin menanggapi "Edit" yang dibuat oleh OP dalam pertanyaan:

Sunting: Salah satu ketakutan saya yang lebih besar adalah bahwa saya seharusnya menggunakan model non-linear untuk menunjukkan hubungannya. Saya merasa bahwa memaksa baik variabel dependen dan independen untuk bekerja sama dalam regresi linier ini menyesatkan dalam beberapa cara.

Kita cenderung lupa bahwa "mentransformasikan variabel" mengarah ke variabel baru , yang perilakunya mungkin sama sekali berbeda dari "yang asli". Contoh termudah adalah membandingkan grafik variabel dan kuadratnya.

Jadi dengan mempertimbangkan logaritma natural dari variabel Anda, Anda tidak lagi memeriksa para relasi di antara mereka , tapi sebuah hubungan antara beberapa fungsi mereka.
Sangat beruntung bahwa konsep matematika "logaritma" dapat dihubungkan dengan konsep "elastisitas", yang menggambarkan hubungan antara perubahan persentase, yang merupakan sesuatu yang kita pahami dari sudut pandang ekonomi dan kita dapat secara bermakna menafsirkan dan menggunakan.

Jika variabel dapat dikatakan wajar untuk menunjukkan "hubungan linear dalam logaritma", itu berarti bahwa level mereka (yaitu variabel aktual) memiliki hubungan non-linear:

dalamySebuah+bdalamxyeSebuah+xb

Jadi mengapa tidak memperkirakan model non-linear?
Dalam prinsip (matematika), tidak ada alasan mengapa tidak. Beberapa masalah praktis adalah:

1) Ada terlalu banyak bentuk hubungan non-linear, hanya ada satu hubungan linear (berbicara secara struktural). Ini adalah masalah "biaya pencarian" untuk spesifikasi yang paling cocok.

2) Hubungan non-linear yang diperoleh mungkin tidak memiliki penjelasan ekonomi yang jelas. Mengapa ini menjadi masalah? Karena, kita tidak mengungkap "hukum alam" di sini, tidak berubah melalui ruang dan waktu. Kami mendekati sebuah fenomena sosial. Memiliki perkiraan yang, apalagi, hanya dapat disajikan sebagai rumus matematika, tanpa alasan ekonomi yang memvalidasi dan mendukungnya, membuat hasilnya sangat tipis.

3) Estimasi non-linear kurang stabil, sehubungan dengan mekanisme algoritma estimasi.

Alecos Papadopoulos
sumber
3

Saya akan mengatakan bahwa model Anda dalam kasus ini tampaknya tidak bermakna jika " tujuan Anda adalah untuk melihat variabel mana yang paling mempengaruhi gaji guru di daerah tertentu di negara bagian saya ". Anda baru saja menunjukkan apa korelasi antara (log) upah dan pengembalian pajak properti. Anda setidaknya harus menggunakan regresi berganda.

Tentu saja, Anda dapat terus berjalan dan mengembangkan strategi identifikasi sepenuhnya matang, tepat, dengan alat metodologi yang tepat untuk memperkirakan intensitas masing-masing efek kausal dan menemukan yang terbesar ... Pada kenyataannya, Anda kemungkinan besar tidak akan dapat untuk melakukannya mengingat kompleksitas tugas semacam itu. Itu hanya sebuah rangkaian perbaikan dan Anda berada di dekat model paling kasar yang mungkin digunakan untuk menjelaskan upah, sangat jauh dari apa yang saya anggap sebagai perkiraan yang dapat diterima dari jawaban atas pertanyaan yang tersirat dalam tujuan Anda. Anda harus mencoba meminta bantuan ahli ekonometrika.

s_a
sumber