ahli! Mungkin, Anda tahu cara menghitung interval kepercayaan untuk xgboost? Formula klasik dengan t-distribusi tidak dapat membantu, karena data saya tidak terdistribusi secara normal. Atau tidak masalah?
Jika Anda menyarankan beberapa literatur, itu akan sangat berguna, tetapi pendekatan dalam R dan Python (dalam konteks perpustakaan xgb) juga bagus.
Mungkin terlihat seperti ini , tetapi bagaimana cara menghitungnya? Dan menemukan ini - benar atau tidak?
PS: Saya tidak bisa menambahkan beberapa gambar, terkait dengan data saya (batas tautan), maaf.
confidence-interval
xgboost
Lu Wao
sumber
sumber
Jawaban:
Jadi, inilah jawabannya! ( cermin )
Untuk membangun batas kepercayaan untuk data yang terdistribusi tidak normal, Anda harus terlebih dahulu membangun regresi kuantil, bukan regresi linier, seperti yang dilakukan secara default. Untuk ini perlu, menggunakan turunan turunan dari artikel atau hanya menyalin kode pada python, untuk menyesuaikan variabel 'objektif'. Juga perlu untuk mengubah fungsi gradien dan fungsi Gaussian. Setelah semuanya diprogram, bangun regresi kuantil untuk kuantil ke-50 (ini akan menjadi regresi awal), dan kemudian dua regresi kuantil untuk dua batas interval (misalnya, 95 dan 5). Akibatnya, Anda tidak hanya mendapatkan model yang lebih akurat untuk regresi awal, tetapi juga interval yang diinginkan.
sumber