Distribusi lebih dari daftar yang diurutkan

10

Katakanlah kita memiliki daftar barang yang dipesan

[a, b, c, ... x, y, z, ...]

Saya mencari keluarga distribusi dengan dukungan pada daftar di atas yang diatur oleh beberapa parameter alpha sehingga:

  • Untuk alpha = 0, ia menetapkan probabilitas 1 ke item pertama, a di atas, dan 0 ke yang lainnya. Artinya, jika kita mengambil sampel dari daftar ini, dengan penggantian, kita selalu mendapatkannya a.
  • Dengan meningkatnya alpha, kami menetapkan probabilitas yang lebih tinggi dan lebih tinggi ke seluruh daftar, menghormati urutan daftar, mengikuti peluruhan ~ eksponensial.
  • Ketika alpha = 1, kami menetapkan probabilitas yang sama untuk semua item dalam daftar, jadi pengambilan sampel dari daftar sama dengan mengabaikan urutannya.

Ini sangat mirip dengan distribusi geometris, tetapi ada beberapa perbedaan penting:

  • Distribusi distribusi geometrik didefinisikan atas semua bilangan asli. Dalam kasus saya di atas, daftar memiliki ukuran tetap.
  • Distribusi geometrik tidak ditentukan untuk alpha = 0.
Amelio Vazquez-Reina
sumber
1
Anda tampaknya menggambarkan keluarga distribusi geometrik terpotong. Namun, ada banyak keluarga yang berperilaku kualitatif seperti deskripsi Anda. Lebih tepatnya, untuk menjelaskan apa yang ingin Anda gunakan untuk keluarga seperti itu.
whuber
Terima kasih @whuber Ya, saya mengerti ada banyak sekali distribusi yang sesuai dengan deskripsi ini. Adakah yang spesifik yang muncul di benak Anda? Saya memiliki sistem yang saat ini mengambil elemen pertama dari daftar ini (mewakili skor), tetapi saya ingin mengacak pilihan ini (dan membuat parameter pengacakan ini). Saya tidak mencari jenis "peluruhan" tertentu berdasarkan alpha. Selama alpha = 0 tidak mewakili pengacakan, yaitu memilih elemen pertama, 1 mewakili "memilih elemen apa pun", dan alfa antara 0 dan 1 mewakili "sesuatu di antara" kedua alfa ini, itu akan cukup baik.
Amelio Vazquez-Reina

Jawaban:

11

Mari kita asumsikan , pangkat elemen daftar , memiliki nilai dalam untuk daftar dengan elemen (ikatan dapat diputus secara acak). Lalu kita bisa mendefinisikan probabilitas memilih menjadi: i { 0 , 1 , , n - 1 } n irii{0,1,,n1}ni

pi=αrik=1nαrk

Ini pada dasarnya hanya sebuah tepat dinormalisasi dipotong distribusi geometris, dan juga terkait dengan dengan fungsi Softmax . Dalam kasus khusus , gunakan konvensi . Perhatikan bahwa penyebut selalu dapat ditulis dalam ekspresi bentuk tertutup sederhana. Untuk dibutuhkan nilai , dan untuk dibutuhkan nilai .0 0 = 1 α < 1 1 - α nα=000=1α<1 α=1n1αn1αα=1n

Dengan , jelas bahwa ini hanya memberikan probabilitas yang sama untuk setiap elemen. Sebagai , pendekatan ini memberikan semua massa probabilitas ke elemen pertama.α 0α=1α0

Dalam daftar dengan 10 elemen, penurunan eksponensial kasar yang Anda minta jelas dengan :α=0.5

p00.5005p10.2502p20.1251p30.0626p40.0313p50.0156p60.0078p70.0039p80.0020p90.0010

Plot berikut menunjukkan bagaimana probabilitas elemen pertama yang dipilih berubah berdasarkan pada , menggunakan daftar panjang 10.α

masukkan deskripsi gambar di sini

Josliber
sumber
Bagus. Ini jauh lebih pintar daripada yang pernah saya harapkan.
Matthew Drury
@ Matthew Ini adalah distribusi geometrik terpotong yang saya sebutkan sebelumnya.
whuber
4

Saya akan mencoba membangun contoh dari prinsip pertama.

Mari kita ambil tiga distribusi sebagai blok bangunan kami:

  • P adalah distribusi yang menetapkan probabilitas satu ke elemen pertama dari daftar, nol untuk yang lainnya.
  • E adalah distribusi yang menetapkan probabilitas untuk elemen pertama dari daftar, ke yang berikutnya, dan seterusnya. Karena daftar ini terbatas, ini tidak akan berjumlah , tetapi kita dapat menormalkan untuk mendapatkan distribusi probabilitas.12141
  • U adalah distribusi seragam pada daftar.

Sekarang kami ingin mengambil keluarga satu parameter kombinasi cembung positif dari distribusi ini

α(t)P+β(t)E+γ(t)U

di mana untuk semua , dengan properti tambahan yang dan . α(t)+β(t)+γ(t)=1t[0,1]α(0)=1γ(1)=1

Secara geometris, kita ingin untuk melacak kurva dalam segitiga sama sisi yang membentang di antara titik yang dimulai di sudut pertama, dan berakhir dan terakhir. Selain itu, karena kami ingin distribusi terlihat "eksponensial" di tengah kali, kami ingin kurva menempati bagian dalam segitiga pada waktu .(α(t),β(t),γ(t))(1,0,0),(0,1,0),(0,0,1)t(0,1)

Berikut opsi untuk kurva:

(1t(1t))(1t,0,t)+t(1t)(13,13,13)

Saya membuat ini bekerja mundur dari properti yang kami inginkan. Kurva membentang di sepanjang tepi segitiga antara awal dan akhir verticies. Sisa rumus hanyalah jumlah cembung dari kurva tepi ini dan satu titik , yang mendorong kurva di sepanjang tepi ke interior pada waktu .( 1(1t,0,t)t(0,1)(13,13,13)t(0,1)

Matthew Drury
sumber