Saya menggunakan paket kuantreg untuk membuat model regresi menggunakan persentil ke-99 dari nilai-nilai saya dalam kumpulan data. Berdasarkan saran dari pertanyaan stackoverflow sebelumnya yang saya tanyakan, saya menggunakan struktur kode berikut.
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
yang saya tunjukkan diplot di atas data saya. Saya telah merencanakan ini menggunakan ggplot2, dengan nilai alpha untuk poin. Saya pikir ekor dari distribusi saya tidak dipertimbangkan secara memadai dalam analisis saya. Mungkin ini disebabkan oleh fakta bahwa ada poin individu, yang diabaikan oleh pengukuran tipe persentil.
Salah satu komentar menyarankan itu
Sketsa paket termasuk bagian tentang regresi kuantil nonlinear dan juga model dengan smoothing splines dll.
Berdasarkan pertanyaan saya sebelumnya, saya mengasumsikan hubungan logaritmik, tetapi saya tidak yakin apakah itu benar. Saya pikir saya bisa mengekstraksi semua poin pada interval persentil ke-99 dan kemudian memeriksanya secara terpisah, tetapi saya tidak yakin bagaimana melakukannya, atau jika itu merupakan pendekatan yang baik. Saya akan sangat menghargai saran tentang cara meningkatkan mengidentifikasi hubungan ini.
sumber
Jawaban:
Semua model salah, tetapi ada juga yang berguna (George Box). Anda memaksa bentuk logrithmic ke kurva Anda, dan jujur itu tidak terlihat buruk. Kecocokan buruk di bagian ekor karena ada sedikit poin di sana; dua parameter yang Anda izinkan akan sesuai dengan sebagian besar data. Dengan kata lain, pada skala log, ekor itu tidak cukup jauh dari sebagian besar data Anda untuk memberikan pengaruh. Itu tidak ada hubungannya dengan sifat kuantitatif dari regresi; OLS juga akan mengabaikan poin-poin tersebut (terutama pada skala log).
Sangat mudah untuk memungkinkan beberapa non-linearitas. Saya sebagian dari splines alami, tetapi sekali lagi, semua model salah:
The
quantreg
paket memiliki beberapa kait khusus untuk splines monoton jika itu menjadi perhatian Anda.sumber