Ini adalah skor F beta:
Artikel Wikipedia menyatakan bahwa . "measures the effectiveness of retrieval with respect to a user who attaches β times as much importance to recall as precision"
Saya tidak mendapatkan ide. Mengapa mendefinisikan seperti itu? Dapatkah saya mendefinisikan seperti ini:F β
Dan bagaimana cara menunjukkannya β times as much importance
?
Jawaban:
Membiarkan menjadi bobot dalam definisi pertama yang Anda berikan dan sebagai bobot dalam definisi kedua, kedua definisi tersebut setara ketika Anda menetapkan , jadi kedua definisi ini hanya mewakili perbedaan notasi dalam definisi skor . Saya telah melihatnya mendefinisikan kedua cara pertama (misalnya pada halaman wikipedia ) dan yang kedua (misalnya di sini ).˜ β ˜ β = β 2 F ββ β~ β~= β2 Fβ
Ukuran diperoleh dengan mengambil rata-rata harmonis dari presisi dan mengingat, yaitu kebalikan dari rata-rata kebalikan dari kebalikan dan kebalikan dari penarikan:F1
Alih-alih menggunakan bobot dalam penyebut yang sama dan menjumlahkan ke 1 ( untuk recall dan untuk presisi), kita dapat menetapkan bobot yang masih berjumlah 1 tetapi untuk yang bobot saat recall adalah kali lebih besar dari bobot pada presisi ( untuk recall dan untuk presisi). Ini menghasilkan definisi kedua Anda dari skor :12 12 β ββ+1 1β+1 Fβ
Sekali lagi, jika kita menggunakan alih-alih sini, kita akan sampai pada definisi pertama Anda, jadi perbedaan antara kedua definisi tersebut hanya notasi.β2 β
sumber
Alasan untuk mendefinisikan skor F-beta dengan adalah persis kutipan yang Anda berikan (yaitu ingin melampirkan kali lebih penting untuk diingat sebagai presisi) memberikan definisi khusus untuk apa artinya melampirkan kali lebih penting untuk diingat daripada presisi.β2 β β
Cara khusus mendefinisikan kepentingan relatif dari dua metrik yang mengarah ke formulasi dapat ditemukan dalam Pengambilan Informasi (Van Rijsbergen, 1979):β2
Motivasi untuk ini:
Untuk melihat bahwa mengarah ini ke formulasi kita bisa mulai dengan rumus umum untuk mean harmonik tertimbang dan dan menghitung derivatif parsial mereka sehubungan dengan dan . Sumber yang dikutip penggunaan (untuk "efektivitas mengukur"), yang hanya dan penjelasan setara apakah kita menganggap atau .β2 P R P R E 1 - F E F
Sekarang, pengaturan derivatif sama untuk satu tempat lain pembatasan pada hubungan antara dan rasio . Mengingat bahwa kami ingin melampirkan kali lebih penting untuk dipanggil sebagai presisi, kami akan mempertimbangkan rasio 1 :α P/ R β R / P
Mendefinisikan sebagai rasio ini dan mengatur ulang untuk memberikan bobot dalam hal :β α β2
Kami memperoleh:
Yang dapat diatur ulang untuk memberikan formulir di pertanyaan Anda.
Dengan demikian, diberikan definisi yang dikutip, jika Anda ingin melampirkan kali lebih penting untuk dipanggil sebagai presisi maka formulasi harus digunakan. Interpretasi ini tidak berlaku jika seseorang menggunakan . Penafsiran yang setara, kurang intuitif, dalam hal kita hanya menggunakan adalah bahwa kita ingin melampirkan kali lebih penting untuk diingat sebagai presisi.β β2 β β β--√
Anda dapat menentukan skor seperti yang Anda sarankan, namun Anda harus menyadari bahwa dalam kasus ini interpretasi yang didiskusikan tidak berlaku lagi atau Anda menyiratkan beberapa definisi lain untuk menghitung trade off antara presisi dan recall.
Catatan kaki:
Referensi:
sumber
Untuk menunjukkan sesuatu dengan cepat.
Saya sebenarnya berpikir sebaliknya - karena lebih tinggi lebih baik dalam penilaian F-β, Anda ingin penyebutnya kecil. Karena itu, jika Anda mengurangi β, maka model tersebut dihukum lebih sedikit karena memiliki skor presisi yang baik. Jika Anda meningkatkan β, maka skor F-β akan dihukum lebih banyak ketika presisi tinggi.
Jika Anda ingin menimbang skor F-β sehingga nilai presisi, β harus 0 <β <1, di mana β-> 0 hanya nilai presisi (pembilangnya menjadi sangat kecil, dan satu-satunya hal dalam penyebut yang diingat, sehingga skor F-β berkurang dengan meningkatnya recall).
http://scikit-learn.org/stable/modules/generated/sklearn.metrics.fbeta_score.html
sumber
Alasan bahwa β ^ 2 dikalikan dengan presisi hanyalah cara F-Skor didefinisikan. Ini berarti bahwa ketika nilai beta meningkat, Anda lebih menghargai presisi. Jika Anda ingin melipatgandakannya dengan recall yang juga akan berfungsi, itu hanya berarti bahwa ketika nilai beta meningkat Anda lebih menghargai recall.
sumber
Nilai beta lebih besar dari 1 berarti kami ingin model kami lebih memperhatikan model Recall dibandingkan dengan Precision. Di sisi lain, nilai kurang dari 1 lebih menekankan Presisi.
sumber