Prediksi regresi kuantitatif

13

Saya tertarik menggunakan regresi kuantil untuk beberapa model saya, tetapi ingin memiliki beberapa klarifikasi tentang apa yang dapat saya capai dengan menggunakan metodologi ini. Saya mengerti saya bisa mendapatkan analisis yang lebih kuat tentang hubungan IV / DV , terutama ketika dihadapkan dengan outlier dan heteroskedastisitas, tetapi dalam kasus saya fokusnya adalah pada prediksi.

Khususnya saya tertarik untuk meningkatkan kecocokan model saya, tanpa menggunakan model non-linear yang lebih kompleks, atau bahkan regresi linier satu demi satu. Pada prediksi, apakah mungkin untuk memilih kuantil hasil probabilitas tertinggi berdasarkan nilai prediktor? Dengan kata lain, apakah mungkin untuk menentukan setiap probabilitas hasil kuantil yang diprediksi, berdasarkan nilai dari para prediktor?

Robert Kubrick
sumber

Jawaban:

8

Sisi kanan model dalam regresi kuantil memiliki struktur dan jenis asumsi yang sama dengan model regresi lainnya seperti OLS. Perbedaan utama dengan regresi kuantil adalah bahwa satu langsung memprediksi quantiles dari distribusi tergantung pada X tanpa menggunakan manipulasi distribusi parametrik (misalnya, ˉ x ± 1,96 s ), dan bahwa tidak ada bentuk distribusi residual diasumsikan selain mengasumsikan bahwa Y adalah variabel kontinu.YXx¯±1.96sY

Frank Harrell
sumber
1
Saya pikir saya mengerti bagaimana proses pemasangan bekerja. Apa yang saya tidak mengerti adalah jika ada cara untuk meningkatkan prediksi (pemilihan parameter kuantil) tanpa mengetahui di mana kuantil pengamatan akan. Bisakah kita mendapatkan ini dari nilai prediktor? Mungkin ada sesuatu yang dapat digunakan berdasarkan distribusi probabilitas prediktor vs pengamatan.
Robert Kubrick
2
Saya pikir Anda perlu melakukan sejumlah besar bacaan latar belakang pada regresi kuantil. Pengamatan tidak terletak "dalam kuantil". Kuantil adalah properti dari distribusi kontinu. 0,5 quantile adalah median; kuantil 0,75 adalah kuartil atas. Kuantil 0,75 dari adalah persentil Y ke-75 ketika X = x . Y|X=xYX=x
Frank Harrell
2
Frank, saya yakin saya perlu belajar lebih banyak tentang regresi kuantil. Sebelum saya menyelam, saya ingin memahami apakah metodologi ini dapat menawarkan beberapa komponen probabilistik untuk pemilihan kuantil, berdasarkan pada prediktor dan model yang sesuai. Untuk setiap rangkaian / kisaran nilai prediktor yang ada harus ada kemungkinan bahwa hasil aktual akan jatuh di wilayah kuantil tertentu.
Robert Kubrick
4

Regresi kuantitatif adalah tentang memprediksi kuantil dari variabel dependen. Dalam regresi "biasa", kami memperkirakan rata-rata dari DV. Tetapi bunga bisa di bagian lain dari DV. Misalnya, Anda mungkin tertarik untuk memperkirakan bayi mana yang baru lahir akan sangat ringan, lagu mana yang akan sangat populer, atau pelanggan mana yang akan membeli banyak barang.

Saya menulis makalah tentang itu untuk NESUG tahun lalu.

Peter Flom - Pasang kembali Monica
sumber
2
Anda memilih kuantil mana yang akan diprediksi berdasarkan apa yang ingin Anda ketahui. Tidak ada program yang dapat memberi tahu Anda pertanyaan mana yang harus ditanyakan!
Peter Flom - Pasang kembali Monica
1
Dengan model yang sesuai, tidak bisakah Anda menghitung probabilitas nilai prediksi untuk jatuh dalam 0,6 kuantil, berdasarkan nilai-nilai prediktor?
Robert Kubrick
2
Bukan "dalam 0,6 kuantil" tetapi pada atau di atas 0,6 kuantil, tapi ya. Tetapi Anda harus memutuskan quantile mana yang ingin Anda prediksi. Dalam regresi OLS, Anda memprediksi mean bersyarat; dalam regresi kuantil Anda memprediksi kuantil bersyarat
Peter Flom - Reinstate Monica
5
Seperti yang ditunjukkan Peter, Anda masih belum memahami komentar sebelumnya. Regresi kuantitatif tidak ada hubungannya dengan menghitung probabilitas jatuh di atas atau di bawah kuantil tertentu (perhatikan bahwa probabilitas jatuh "dalam" kuantil 0,6 adalah nol menurut definisi). Anda mencari tahu jika Anda tertarik dalam memprediksi median atau kuantil lainnya, maka lakukanlah. Kuantil bersyarat adalah angka tunggal bukan rentang.
Frank Harrell
1
Jika saya mengerti, Anda memilih kuantil mana yang akan digunakan untuk prediksi Anda tetapi apakah tidak ada cara untuk memilih kuantil mana yang terbaik untuk prediksi e