Mengonversi daftar peringkat parsial menjadi peringkat global

13

Saya sedang mengerjakan sesuatu seperti masalah berikut. Saya memiliki banyak pengguna dan N buku. Setiap pengguna membuat peringkat yang diurutkan dari semua buku yang dia baca (yang kemungkinan merupakan subset dari buku N), misalnya, Buku 1> Buku 40> Buku 25.

Sekarang saya ingin mengubah peringkat masing-masing pengguna ini menjadi peringkat tunggal yang diperintahkan dari semua buku.

Apakah ada pendekatan yang baik atau standar untuk dicoba? Sejauh ini, saya memikirkan model Bradley-Terry yang diterapkan pada perbandingan berpasangan, tetapi saya bertanya-tanya apakah ada hal lain.

raegtin
sumber
2
Saya pikir Anda akan mengalami banyak masalah dengan sparsity, kecuali para pengguna (karena alasan tertentu) membaca buku yang sama. Tetapi mengingat n orang, dan mengingat bahwa kebanyakan orang membaca buku yang relatif sedikit, sebagian besar pasangan hanya akan memiliki satu orang yang membuat perbandingan. (Angka mediannya adalah 6 per orang per tahun, lihat Pew
Peter Flom - Reinstate Monica
2
(+1) raegtin, Anda mengajukan pertanyaan menarik dan menarik. Saya suka model BT, tapi sepertinya agak dipaksakan di sini. Apakah Anda terbiasa dengan literatur pemfilteran kolaboratif? Ini bukan masalah yang sama, tetapi beberapa konsep dan teknik bisa dipinjam. Sebuah pertanyaan yang dibiarkan tidak terjawab di sini adalah mengapa orang harus percaya bahwa buku-buku itu dapat diberi peringkat yang jelas dan jelas. (Bagaimana Anda menangani dua pengguna, dua buku kasus, misalnya?)
kardinal
@Peter Flom: Benar, sebagian besar pasangan tidak memiliki perbandingan. Tapi saya berharap itu baik-baik saja, karena jika Anda tahu bahwa A> B dan B> C, maka bahkan jika A dan C tidak dibandingkan secara langsung, Anda dapat menyimpulkan A> C.
raegtin
@ cardinal: Ya, model BT sepertinya dipaksakan di sini, tapi itu satu-satunya hal yang bisa saya pikirkan saat ini. Saya akrab dengan literatur penyaringan kolaboratif, tapi saya tidak yakin bagaimana ini berlaku di sini, karena saya ingin peringkat, bukan kesamaan. Memang benar bahwa peringkat global tunggal tidak selalu masuk akal (misalnya, apakah masuk akal untuk membandingkan buku anak-anak dengan buku dewasa? Fiksi vs non-fiksi?), Tetapi secara praktis, ini masih berguna. Daftar buku "Best of" muncul setiap saat :)
raegtin
Juga, saya tidak begitu peduli tentang pemesanan dekat (mis. Apakah buku peringkat # 1 benar-benar lebih baik daripada buku # 2), tetapi memesan secara agregat (misalnya, saya ingin 10% buku teratas dalam pemesanan saya untuk lebih baik dari 10% terbawah atau tengah 10%).
raegtin

Jawaban:

2

Jika Anda tertarik digunakan (lebih dari dalam pembangunan), Anda harus memberikan mencoba rankade , sistem peringkat kami.

Rankade gratis dan mudah digunakan, dan ini berbeda dari model Bradley-Terry dan sistem peringkat Elo (berikut perbandingannya ) karena dapat mengelola pertandingan dengan 2+ faksi (yaitu buku, dalam skenario Anda). Memasukkan peringkat yang dipesan pengguna (seperti kecocokan antara dua buku atau lebih, dengan kedudukan akhir terperinci, termasuk ikatan) Anda akan memperoleh peringkat urutan tunggal dari semua buku yang Anda cari. Dalam kecanduan, peringkat memberi Anda kesempatan untuk memeriksa evolusi waktu untuk peringkat buku, dan statistik untuk pencocokan buku, dan banyak lagi.

Tomaso Neri
sumber
1
Anda harus menggambarkan algoritma Anda, setidaknya secara umum, sebagai pendekatan. Dan tautan ke makalah yang dideskripsikan secara lengkap. Kalau tidak, jawaban Anda mungkin dianggap hanya sebagai iklan.
ttnphns
1
Saya menambahkan tautan untuk perbandingan sederhana antara ree dan sistem peringkat yang paling dikenal. Pernyataan pertama mengatakan Jika Anda tertarik menggunakan (lebih dari pengembangan) , maka itu diusulkan sebagai solusi untuk masalah tersebut (peringkat menampilkan GUI, sementara Bradley-Terry dan Plackett-Luce perlu implementasi yang akan digunakan), lebih dari satu jalur untuk mencapai solusi yang diminta.
Tomaso Neri
1

Model pemeringkatan Plackett-Luce menangani masalah ini dan merupakan teknik berbasis kemungkinan di mana kemungkinan dimaksimalkan menggunakan rutinisasi maksimalisasi mayorisasi, yang mirip dengan Ekspektasi Maksimalisasi, dalam arti bahwa mereka menggunakan fungsi tujuan tambahan atas fungsi kemungkinan yang merupakan dioptimalkan untuk menjamin maksimalisasi monotonik iteratif dari fungsi kemungkinan. (Lihat algoritma MM untuk model peringkat Plackett-Luce oleh David Hunter). Dia juga menyediakan kode.

Dari perspektif peringkat, mereka adalah perpanjangan dari model Bradley-Terry yang Anda sebutkan di posting Anda. Model Bradley-Terry memperkirakan peringkat global dari sampel peringkat berpasangan. Model Plackett-Luce memperluas ini ke peringkat panjang> = 2. Mereka juga memungkinkan untuk setiap sampel menjadi peringkat dengan panjang yang berbeda.

Ini sangat cocok dengan dataset Anda:

Buku 1> Buku 40> Buku 25

Buku 40> Buku 30

Buku 25> Buku 17> Buku 11> Buku 3 dll.

mobil jenazah
sumber