Regresi kuantil (QR) kadang-kadang dikatakan untuk mengungkapkan hubungan yang berbeda antara variabel pada kuantil yang berbeda dari distribusi. Misalnya Le Cook et al. "Berpikir di luar rata-rata: panduan praktis untuk menggunakan metode regresi kuantil untuk penelitian layanan kesehatan" menyiratkan bahwa QR memungkinkan hubungan antara hasil yang menarik dan variabel penjelas menjadi tidak konstan di seluruh nilai variabel yang berbeda.
Namun, sejauh yang saya tahu, dalam model regresi linier standar dengan menjadi iid dan independen dari , penaksir QR untuk lereng
Saya kira situasinya berbeda ketika beberapa asumsi model linear standar dilanggar, misalnya dalam bentuk heteroskedastisitas bersyarat tertentu. Kemudian mungkin estimator kemiringan QR berkumpul untuk sesuatu yang lain dari kemiringan sebenarnya dari model linier dan entah bagaimana mengungkapkan hubungan yang berbeda pada kuantil yang berbeda.
Apa yang salah? Bagaimana seharusnya saya memahami / menafsirkan klaim bahwa regresi kuantil mengungkapkan hubungan yang berbeda antara variabel-variabel pada kuantil yang berbeda?
sumber
Jawaban:
"Kemiringan sejati" dalam model linier normal memberi tahu Anda seberapa besar respons rata - rata berubah berkat kenaikan satu poin dalam . Dengan mengasumsikan normalitas dan varians yang sama, semua kuantil dari distribusi kondisional dari respons bergerak sejalan dengan itu. Kadang-kadang, asumsi-asumsi ini sangat tidak realistis: varians atau kemiringan distribusi kondisional bergantung pada dan karenanya, kuantilasinya bergerak dengan kecepatannya sendiri ketika meningkatkanx x x . Dalam QR, Anda akan segera melihat ini dari perkiraan kemiringan yang sangat berbeda. Karena OLS hanya peduli tentang rata-rata (yaitu kuantil rata-rata), Anda tidak dapat memodelkan setiap kuantil secara terpisah. Di sana, Anda sepenuhnya bergantung pada asumsi bentuk tetap dari distribusi kondisional ketika membuat pernyataan tentang kuantilnya.
EDIT: Cantumkan komentar dan ilustrasikan
Jika Anda ingin membuat asumsi yang kuat, tidak ada gunanya menjalankan QR karena Anda selalu dapat menghitung kuantil bersyarat melalui mean bersyarat dan varian tetap. Kemiringan "benar" dari semua kuantil akan sama dengan kemiringan sebenarnya dari rata-rata. Dalam sampel tertentu, tentu saja akan ada beberapa variasi acak. Atau Anda bahkan mungkin mendeteksi bahwa asumsi ketat Anda salah ...
Biarkan saya ilustrasikan dengan sebuah contoh dalam R. Ini menunjukkan garis kuadrat terkecil (hitam) dan kemudian merah yang dimodelkan 20%, 50%, dan 80% kuantil data yang disimulasikan menurut hubungan linear berikut sehingga tidak hanya rata-rata bersyarat tergantung pada tetapi juga varians.
Kode untuk menghasilkan gambar:
sumber