Mengapa para peneliti di bidang ekonomi menggunakan regresi linier untuk variabel respon biner?

13

Akhir-akhir ini, saya harus membaca beberapa makalah di bidang ekonomi (bidang yang saya tidak terlalu kenal). Satu hal yang saya perhatikan adalah bahwa bahkan ketika variabel responnya biner, model regresi linier yang dipasang menggunakan OLS ada di mana-mana. Karena itu pertanyaan saya adalah:

Mengapa regresi linier lebih disukai daripada misalnya regresi logistik di bidang ekonomi? Apakah ini sekadar praktik biasa atau ini merupakan prosedur yang dianjurkan secara aktif (dalam makalah, oleh guru, dll.)?

Harap dicatat bahwa saya tidak bertanya mengapa menggunakan regresi linier dengan respons biner mungkin merupakan ide yang buruk, atau apa metode alternatifnya. Sebaliknya, saya bertanya mengapa orang menggunakan regresi linier dalam pengaturan ini karena saya tahu jawaban untuk dua pertanyaan ini.

MånsT
sumber
5
Bisakah Anda memberikan contoh?
Stephan Kolassa
7
Ini tidak benar. Ekonomi dan ekonometrik juga memiliki literatur yang luas tentang logit dan probit dan model terkait. Saya juga orang luar dan saya tidak bisa dengan mudah mengukur penggunaan relatif, tetapi literatur cukup besar untuk menyangkal "di mana-mana" (artinya, di mana-mana!). Ada pertanyaan di sini tentang mengapa apa yang disebut model probabilitas linier digunakan sama sekali dan saya tidak berpikir penjelasannya perlu mendalam atau sulit untuk ditemukan: mudah dimengerti dan kadang-kadang berfungsi dengan baik.
Nick Cox
3
Ekonomi hanya memiliki hubungan yang sangat kasual dengan matematika. Saya tidak akan terlalu khawatir tentang hal itu.
Sycorax berkata Reinstate Monica
1
@ Scorax Saya punya perasaan serupa. Dan jika seseorang ceroboh dengan matematika, ia masih dapat membangun sesuatu yang "bekerja".
Haitao Du
1
@ Scorax Itu tidak benar atau adil. Tentu saja, menyatakan bahwa "Anda tidak akan terlalu khawatir tentang hal itu" tidak bertanggung jawab atas pertanyaan itu. Bergantung pada sub-bidang, Ekonomi dapat memiliki hubungan yang sangat kuat dengan matematika dan statistik. Hanya saja, para Ekonom sering peduli dengan inferensial kausal sementara kebetulan juga harus berurusan dengan data pengamatan (seperti banyak ilmu sosial lakukan). Ini membuatnya sangat sulit untuk membangun kekuatan matematika yang kuat tanpa membawa intuisi ekonomi.
StAtS

Jawaban:

18

Posting blog ini oleh pada blog ekonometrik Dave Giles 'sebagian besar menguraikan kelemahan dari Linear Probability Model (LPM).

Namun , ia memasukkan daftar pendek alasan mengapa peneliti memilih untuk menggunakannya:

  • Secara komputasi lebih sederhana.
  • Lebih mudah untuk menafsirkan "efek marginal".
  • Ini menghindari risiko salah spesifikasi "fungsi tautan".
  • Ada komplikasi dengan Logit atau Probit jika Anda memiliki regresor dummy endogen.
  • Perkiraan efek marginal dari model LPM, Logit dan Probit biasanya sangat mirip, terutama jika Anda memiliki ukuran sampel yang besar.

Saya tidak tahu bahwa LPM adalah yang paling umum digunakan dibandingkan dengan logit atau probit tetapi beberapa alasan di atas masuk akal bagi saya.

Hebat38
sumber
2
+1, terima kasih untuk istilah Linear Probability Model, saya tidak tahu sebelumnya.
Haitao Du
1
Ada bagian yang bagus tentang ini di "Mostly Harmless Econometrics" oleh Angrist dan Pischke, jika Anda tertarik lebih dalam.
shf8888
2

Saya memiliki pertanyaan serupa ketika membaca makalah dari yang lain. Dan mengajukan banyak pertanyaan terkait hal ini, seperti yang ada di komunitas Education Data Mining ini: Mengapa menggunakan kuadrat kerugian pada probabilitas alih-alih kerugian logistik?

Di sini saya akan menyajikan banyak pendapat pribadi.


Saya merasa fungsi kerugian tidak terlalu penting dalam banyak kasus penggunaan praktis. Beberapa peneliti mungkin tahu lebih banyak tentang kuadrat kerugian dan membangun sistemnya, ia masih bekerja dan menyelesaikan masalah dunia nyata. Para peneliti mungkin tidak pernah tahu kehilangan logistik atau kehilangan engsel, dan ingin mencobanya. Lebih lanjut, mereka mungkin tidak tertarik untuk menemukan model matematika yang optimal, tetapi ingin menyelesaikan masalah nyata yang tidak ada yang berusaha untuk memecahkannya sebelumnya.

Ini adalah contoh lain: jika Anda memeriksa jawaban atas pertanyaan saya, semuanya mirip. Apa dampak dari memilih fungsi kerugian yang berbeda dalam klasifikasi untuk memperkirakan kerugian 0-1


Lebih banyak pemikiran: penelitian pembelajaran mesin mungkin menghabiskan banyak waktu pada model apa yang akan dipilih, dan bagaimana mengoptimalkan model. Ini karena peneliti pembelajaran mesin mungkin tidak memiliki kemampuan untuk mengumpulkan lebih banyak data / mendapatkan lebih banyak tindakan. Dan pekerjaan seorang peneliti pembelajaran mesin adalah mendapatkan matematika yang lebih baik, tidak memecahkan masalah dunia nyata tertentu dengan lebih baik.

Di sisi lain, di dunia nyata, jika datanya lebih baik, itu mengalahkan semua hal. Jadi, memilih jaringan saraf atau hutan acak mungkin tidak terlalu penting. Semua model ini mirip dengan seseorang yang ingin menggunakan pembelajaran mesin sebagai alat untuk memecahkan masalah dunia nyata. Seseorang yang tidak tertarik mengembangkan matematika atau alat mungkin menghabiskan lebih banyak waktu untuk menggunakan pengetahuan domain spesifik untuk membuat sistem lebih baik.

Seperti yang saya sebutkan di komentar. Dan jika seseorang ceroboh dengan matematika, ia masih dapat membangun sesuatu yang berfungsi.

Haitao Du
sumber
1
(+1) Itu banyak "kutipan" hxd, apa artinya berkomunikasi? Apakah "berhasil" berarti "mereka pikir itu berhasil, tetapi tidak" atau apakah itu berarti "agak berhasil"?
Matthew Drury
@MatthewDrury terima kasih atas komentarnya. Saya pikir saya punya banyak perasaan pribadi dan tidak tahu bagaimana menuliskannya. Saya pikir banyak dari mereka tidak formal atau terlalu subjektif. itu sebabnya saya punya banyak kutipan.
Haitao Du
Saya pikir lebih jelas untuk hanya menandai mereka sebagai pendapat pribadi. Inilah yang saya lakukan di kelas bersama siswa: "Ini berbatasan dengan pendapat pribadi tetapi, SVM payah" (bukan contoh nyata, atau apakah itu ...)
Matthew Drury
@MatthewDrury terima kasih telah menasihati saya untuk menulis, tidak ada kutipan dalam jawabannya!
Haitao Du