Katakanlah kita memiliki daftar barang yang dipesan
[a, b, c, ... x, y, z, ...]
Saya mencari keluarga distribusi dengan dukungan pada daftar di atas yang diatur oleh beberapa parameter alpha sehingga:
- Untuk alpha = 0, ia menetapkan probabilitas 1 ke item pertama, a di atas, dan 0 ke yang lainnya. Artinya, jika kita mengambil sampel dari daftar ini, dengan penggantian, kita selalu mendapatkannya
a
. - Dengan meningkatnya alpha, kami menetapkan probabilitas yang lebih tinggi dan lebih tinggi ke seluruh daftar, menghormati urutan daftar, mengikuti peluruhan ~ eksponensial.
- Ketika alpha = 1, kami menetapkan probabilitas yang sama untuk semua item dalam daftar, jadi pengambilan sampel dari daftar sama dengan mengabaikan urutannya.
Ini sangat mirip dengan distribusi geometris, tetapi ada beberapa perbedaan penting:
- Distribusi distribusi geometrik didefinisikan atas semua bilangan asli. Dalam kasus saya di atas, daftar memiliki ukuran tetap.
- Distribusi geometrik tidak ditentukan untuk alpha = 0.
distributions
sampling
discrete-data
Amelio Vazquez-Reina
sumber
sumber
Jawaban:
Mari kita asumsikan , pangkat elemen daftar , memiliki nilai dalam untuk daftar dengan elemen (ikatan dapat diputus secara acak). Lalu kita bisa mendefinisikan probabilitas memilih menjadi: i { 0 , 1 , … , n - 1 } n irsaya i {0,1,…,n−1} n i
Ini pada dasarnya hanya sebuah tepat dinormalisasi dipotong distribusi geometris, dan juga terkait dengan dengan fungsi Softmax . Dalam kasus khusus , gunakan konvensi . Perhatikan bahwa penyebut selalu dapat ditulis dalam ekspresi bentuk tertutup sederhana. Untuk dibutuhkan nilai , dan untuk dibutuhkan nilai .0 0 = 1 α < 1 1 - α nα=0 00=1 α<1 α=1n1−αn1−α α=1 n
Dengan , jelas bahwa ini hanya memberikan probabilitas yang sama untuk setiap elemen. Sebagai , pendekatan ini memberikan semua massa probabilitas ke elemen pertama.α → 0α=1 α→0
Dalam daftar dengan 10 elemen, penurunan eksponensial kasar yang Anda minta jelas dengan :α=0.5
Plot berikut menunjukkan bagaimana probabilitas elemen pertama yang dipilih berubah berdasarkan pada , menggunakan daftar panjang 10.α
sumber
Saya akan mencoba membangun contoh dari prinsip pertama.
Mari kita ambil tiga distribusi sebagai blok bangunan kami:
Sekarang kami ingin mengambil keluarga satu parameter kombinasi cembung positif dari distribusi ini
di mana untuk semua , dengan properti tambahan yang dan .α(t)+β(t)+γ(t)=1 t∈[0,1] α(0)=1 γ(1)=1
Secara geometris, kita ingin untuk melacak kurva dalam segitiga sama sisi yang membentang di antara titik yang dimulai di sudut pertama, dan berakhir dan terakhir. Selain itu, karena kami ingin distribusi terlihat "eksponensial" di tengah kali, kami ingin kurva menempati bagian dalam segitiga pada waktu .(α(t),β(t),γ(t)) (1,0,0),(0,1,0),(0,0,1) t∈(0,1)
Berikut opsi untuk kurva:
Saya membuat ini bekerja mundur dari properti yang kami inginkan. Kurva membentang di sepanjang tepi segitiga antara awal dan akhir verticies. Sisa rumus hanyalah jumlah cembung dari kurva tepi ini dan satu titik , yang mendorong kurva di sepanjang tepi ke interior pada waktu .( 1(1−t,0,t) t∈(0,1)(13,13,13) t∈(0,1)
sumber