Saya menggunakan regresi kuantil untuk menemukan prediktor persentil ke-90 data saya. Saya melakukan ini di R menggunakan quantreg
paket. Bagaimana saya bisa menentukan untuk regresi kuantil yang akan menunjukkan berapa banyak variabilitas dijelaskan oleh variabel prediktor?
Apa yang benar-benar ingin saya ketahui: "Apakah ada metode yang dapat saya gunakan untuk menemukan berapa banyak variabilitas yang sedang dijelaskan?". Tingkat signifikansi oleh nilai-nilai P tersedia dalam output dari perintah: summary(rq(formula,tau,data))
. Bagaimana saya bisa mendapatkan kebaikan yang bugar?
Jawaban:
Koenker dan Machado [ 1 ] menggambarkan R 1 , ukuran lokal goodness of fit di tertentu ( τ ) kuantil.[ 1 ] R1 τ
Biarkan dan menjadi perkiraan koefisien untuk model lengkap, dan model terbatas, dan biarkan dan menjadi ketentuan sesuai . ~ β (τ) V ~ V Vβ^( τ) β~( τ) V^ V~ V
Mereka mendefinisikan kriteria goodness of fit .R1( τ) = 1 - V^V~
Koenker memberikan kode untuk sini ,V
Jadi jika kita menghitung untuk model dengan intersep-only ( - atau dalam cuplikan kode di bawah) dan kemudian model tidak terbatas ( ), kita dapat menghitung itu - setidaknya secara notasi - agak seperti .~ V V R 2V V~ V^ R2
V0
R1 <- 1-Vhat/V0
Sunting: Dalam kasus Anda, tentu saja, argumen kedua, yang akan diletakkan di tempat
f$tau
panggilan dalam baris kode kedua, akan menjadi nilai apa pun yangtau
Anda gunakan. Nilai di baris pertama hanya menetapkan default.'Menjelaskan perbedaan tentang mean' sebenarnya bukan apa yang Anda lakukan dengan regresi kuantil, jadi Anda seharusnya tidak mengharapkan untuk memiliki ukuran yang benar-benar setara.
Saya tidak berpikir konsep diterjemahkan dengan baik ke regresi kuantil. Anda dapat mendefinisikan berbagai jumlah analog yang kurang lebih, seperti di sini, tetapi apa pun yang Anda pilih, Anda tidak akan memiliki sebagian besar properti yang dimiliki nyata dalam regresi OLS. Anda harus jelas tentang properti apa yang Anda butuhkan dan apa yang tidak Anda butuhkan - dalam beberapa kasus, dimungkinkan untuk memiliki ukuran yang melakukan apa yang Anda inginkan.R 2R2 R2
-
Goodness of Fit dan Proses Inferensi Terkait untuk Regresi Kuantil,
Jurnal Asosiasi Statistik Amerika, 94 : 448, 1296-1310
sumber
tau
kapan Anda memanggil fungsi. Saya akan menjelaskan di pos.Ukuran pseudo- disarankan oleh Koenker dan Machado (1999) dalam JASA mengukur goodness of fit dengan membandingkan jumlah penyimpangan tertimbang untuk model yang diminati dengan jumlah yang sama dari model di mana hanya intersep yang muncul. Ini dihitung sebagaiR2
di mana y i = a τ + ß τ x adalah dipasang τ th kuantil untuk pengamatan saya , dan ˉ y = ß τ adalah nilai dipasang dari model intercept-satunya.y^saya= ατ+ βτx τ saya y¯= βτ
Berikut ini contoh dalam R:
Ini mungkin bisa dilakukan dengan lebih elegan.
sumber
R_1(\tau) = 1 -
karakter terakhir adalah semacam kekacauan. Bisakah Anda memeriksanya? Mungkin Anda disisipkan beberapa karakter non-standar daripada menggunakan Tex.