Apa perbedaan antara regresi kuantil kondisional dan tanpa syarat?

38

Estimator regresi kuantil bersyarat oleh Koenker dan Basset (1978) untuk kuantil didefinisikan sebagaiβ Qτth

β^QR=minbi=1nρτ(yiXibτ)
mana adalah fungsi pembobotan ulang (disebut "periksa" -fungsi) residu u_i .ρτ=ui(τ1(ui<0))ui

Dalam sebuah makalah oleh Firpo et al. (2009) , penulis menyatakan bahwa regresi kuantitatif bersyarat tidak memberikan efek yang menarik. Mereka mengatakan bahwa hasil kondisional tidak dapat digeneralisasikan ke populasi (dalam OLS kita selalu dapat beralih dari kondisional ke tanpa syarat melalui hukum harapan yang diulang-ulang tetapi ini tidak tersedia untuk kuantil). Ini karena τth quantile tanpa syarat yi mungkin tidak sama dengan τth quantile bersyarat yi|Xi .

Jika saya mengerti dengan benar, bagian dari masalah adalah kovariat mana yang termasuk dalam Xi memiliki efek pada variabel peringkat usaya karena dimasukkannya kovariat membagi kesalahan menjadi komponen yang diamati dan tidak teramati. Saya tidak bisa mengerti mengapa ini menyebabkan masalah.

Ini pertanyaan saya:

  1. Apa yang membuat efek kuantil bersyarat dan tanpa syarat berbeda satu sama lain?
  2. Bagaimana saya bisa menafsirkan koefisien regresi kuantil bersyarat?
  3. Apakah regresi kuantitatif bersyarat bias?

Referensi:

  • Koenker, R., & Bassett, G. (1978) "Jumlah Regresi", Econometrica , Vol. 46 (1), hlm. 33-50.
  • Firpo, S. et al. (2009) "Regresi Kuantil Tanpa Syarat", Econometrica , Vol. 77 (3), hlm. 953-973.
AlexH
sumber
1
Saya akan merekomendasikan Anda untuk memeriksa bab 7 dari "Sebagian besar ekonometrik yang tidak berbahaya" oleh Angrist dan Pischke. Ini memiliki beberapa contoh interpretasi koefisien regresi kuantil dan implikasi dari kuantil yang bersyarat ke X. Saya setuju dengan Anda bahwa implikasi tersebut tidak valid untuk menggunakan model kecuali Anda ingin mengisolasi dampak dari satu kovariat. Saya pikir regresi kuantitatif juga bias; Angrist dan Pischke mengeksplorasi beberapa metode yang diusulkan untuk mengontrol variabel yang dihilangkan, misalnya.
Juan C
1
Bukan jawaban, tetapi mungkin suatu petunjuk - regresi kuantitatif dapat dianggap sebagai masalah "data hilang", di mana data yang hilang adalah bobot yang digunakan dalam regresi OLS tertimbang. Misalnya menggunakan distribusi eksponensial untuk bobot terbalik memberikan Anda median regresi ( ). τ=50
probabilityislogic

Jawaban:

29

Pengaturan
Misalkan Anda memiliki regresi sederhana dari bentuk mana hasilnya adalah pendapatan log orang i , S i adalah jumlah tahun sekolah, dan ϵ i

dalamysaya=α+βSsaya+ϵsaya
sayaSsayaϵsaya adalah istilah kesalahan. Alih-alih hanya melihat efek rata-rata pendidikan terhadap pendapatan, yang akan Anda dapatkan melalui OLS, Anda juga ingin melihat efeknya di berbagai bagian distribusi hasil.

1) Apa perbedaan antara pengaturan kondisional dan tanpa syarat
Pertama plot pendapatan log dan mari kita memilih dua individu, dan B , di mana A berada di bagian bawah dari distribusi pendapatan tanpa syarat dan BSEBUAHBSEBUAHB di bagian atas. masukkan deskripsi gambar di sini

Itu tidak terlihat sangat normal tapi itu karena saya hanya menggunakan 200 pengamatan dalam simulasi, jadi jangan pedulikan itu. Sekarang apa yang terjadi jika kita mengkondisikan penghasilan kita pada tahun-tahun pendidikan? Untuk setiap tingkat pendidikan Anda akan mendapatkan distribusi pendapatan "bersyarat", yaitu Anda akan menghasilkan plot kepadatan seperti di atas tetapi untuk setiap tingkat pendidikan secara terpisah.

masukkan deskripsi gambar di sini

SEBUAHBSEBUAH cukup baik di antara pir-nya dalam kurun waktu 5 tahun pendidikan, maka ia berada di persentil ke-90.

Jadi begitu Anda mengkondisikan pada variabel lain, kini telah terjadi bahwa satu orang sekarang berada di bagian atas dari distribusi bersyarat sedangkan orang itu akan berada di bagian bawah dari distribusi tanpa syarat - inilah yang mengubah penafsiran koefisien regresi kuantil . Mengapa?

E[ysaya|Ssaya]=E[ysaya]Qτ(ysaya|Ssaya)Qτ(ysaya)τ. Ini dapat diselesaikan dengan terlebih dahulu melakukan regresi kuantil kondisional dan kemudian mengintegrasikan variabel-variabel pengkondisian untuk mendapatkan efek yang terpinggirkan (efek tanpa syarat) yang dapat Anda interpretasikan seperti dalam OLS. Contoh dari pendekatan ini disediakan oleh Powell (2014) .

2) Bagaimana menafsirkan koefisien regresi kuantil?
Ini adalah bagian yang sulit dan saya tidak mengklaim memiliki semua pengetahuan di dunia tentang hal ini, jadi mungkin seseorang memberikan penjelasan yang lebih baik untuk ini. Seperti yang Anda lihat, peringkat individu dalam distribusi pendapatan bisa sangat berbeda untuk apakah Anda mempertimbangkan distribusi kondisional atau tanpa syarat.


β90=0,13

Untuk regresi kuantil tanpa syarat
Itu seperti koefisien OLS yang biasa Anda tafsirkan. Kesulitan di sini bukanlah interpretasi tetapi bagaimana mendapatkan koefisien-koefisien yang tidak selalu mudah (integrasi mungkin tidak berfungsi, misalnya dengan data yang sangat jarang). Cara lain untuk memarjinalkan koefisien regresi kuantil tersedia seperti metode Firpo (2009) menggunakan fungsi pengaruh terpusat. Buku oleh Angrist dan Pischke (2009) yang disebutkan dalam komentar menyatakan bahwa marginalisasi koefisien regresi kuantil masih merupakan bidang penelitian aktif dalam ekonometrik - meskipun sejauh yang saya tahu kebanyakan orang saat ini puas dengan metode integrasi (contohnya adalah Melly dan Santangelo (2015) yang menerapkannya pada model Changes-in-Changes).

3) Apakah koefisien regresi kuantitatif bersyarat bias? Tidak (dengan asumsi Anda memiliki model yang ditentukan dengan benar), mereka hanya mengukur sesuatu yang berbeda yang Anda mungkin atau mungkin tidak tertarik. Efek yang diperkirakan pada distribusi daripada individu adalah seperti yang saya katakan tidak terlalu menarik - sebagian besar waktu. Untuk memberikan contoh balasan: pertimbangkan pembuat kebijakan yang memperkenalkan tahun tambahan wajib sekolah dan mereka ingin tahu apakah ini mengurangi ketidaksetaraan pendapatan dalam populasi.

βτβ10=β90=0.8 , satu tahun tambahan pendidikan akan meningkatkan pendapatan sebesar 8% di seluruh distribusi pendapatan.

Ketika efek perlakuan kuantil TIDAK konstan (seperti pada dua panel bawah), Anda juga memiliki efek skala selain efek lokasi. Dalam contoh ini bagian bawah dari distribusi pendapatan bergeser ke atas lebih dari atas, sehingga perbedaan 90-10 (ukuran standar ketidaksetaraan pendapatan) menurun dalam populasi. masukkan deskripsi gambar di sini

Anda tidak tahu orang mana yang mendapat manfaat dari itu atau di bagian mana dari distribusi orang-orang yang memulai di bagian bawah (untuk menjawab pertanyaan itu Anda memerlukan koefisien regresi kuantil tanpa syarat). Mungkin kebijakan ini menyakiti mereka dan menempatkan mereka di bagian yang lebih rendah dibandingkan dengan yang lain, tetapi jika tujuannya adalah untuk mengetahui apakah satu tahun tambahan pendidikan wajib mengurangi penyebaran pendapatan maka ini informatif. Contoh dari pendekatan semacam itu adalah Brunello et al. (2009) .

Jika Anda masih tertarik pada bias regresi kuantil karena sumber endogenitas, lihat Angrist et al (2006) di mana mereka memperoleh rumus bias variabel yang dihilangkan untuk konteks kuantil.

Andy
sumber
1
Apakah saat ini ada implementasi R dari teknik ini?
kandil
1

Selain jawaban yang sangat bagus yang diberikan oleh @Andy. Anda mungkin ingin memeriksa:

Borah, BJ, & Basu, A. (2013). "Menyoroti perbedaan antara pendekatan regresi kuantil bersyarat dan tanpa syarat melalui aplikasi untuk menilai kepatuhan pengobatan." Ekonomi Kesehatan, 22 (9), 1052-1070. http://doi.org/10.1002/hec.2927

JustGettin Mulai
sumber