Dimungkinkan untuk mengambil sampel dari distribusi kategoris yang diberikan probabilitas log tanpa meninggalkan ruang log menggunakan trik Gumbel-max . Idenya adalah bahwa jika Anda diberi probabilitas log yang tidak normal α1,…,αk , itu dapat diterjemahkan ke probabilitas yang tepat menggunakan fungsi softmax
pi=exp(αi)∑jexp(αj)
kemudian untuk mengambil sampel dari distribusi tersebut, Anda dapat menggunakan fakta bahwa jika g1,…,gk∼G(0) adalah sampel independen yang diambil dari distribusi Gumbel standar yang ditentukan oleh lokasi m ,
F(G≤g)=exp(−exp(−g+m))
maka bisa ditunjukkan (lihat referensi di bawah) itu
argmaxi{gi+αi}maxi{gi+αi}∼exp(αi)∑jexp(αj)∼G(log∑iexp{αi})
dan kita bisa ambil
z=argmaxi{gi+αi}
sebagai sampel dari distribusi kategorikal yang oleh . Pendekatan ini dijelaskan secara lebih rinci dalam entri blog oleh Ryan Adams dan Laurent Dinh , apalagi Chris J. Maddison, Daniel Tarlow dan Tom Minka memberikan speach ( slide ) pada konferensi Neural Information Processing Systems (2014) dan menulis makalah berjudul A * Pengambilan sampel yang menggeneralisasi ide-ide tersebut (lihat juga Maddison, 2016; Maddison, Mnih dan Teh, 2016; Jang dan Poole, 2016), yang merujuk pada Yellott (1977) menyebut dirinya sebagai salah satu di antara mereka yang pertama kali menggambarkan properti ini.p1,…,pk
Sangat mudah untuk mengimplementasikannya menggunakan inverse transform sampling dengan mengambil mana diambil dari distribusi yang seragam pada . Ini tentu saja bukan algoritma yang paling efisien waktu untuk pengambilan sampel dari distribusi kategorikal, tetapi memungkinkan Anda untuk tetap berada di ruang log apa yang mungkin menjadi keuntungan dalam beberapa skenario.u i ( 0 , 1 )gi=−log(−logui)ui(0,1)
Maddison, CJ, Tarlow, D., & Minka, T. (2014). Pengambilan sampel *. [Dalam:] Kemajuan dalam Sistem Pemrosesan Informasi Saraf Tiruan (hlm. 3086-3094).
Yellott, JI (1977). Hubungan antara aksioma pilihan Luce, teori penilaian komparatif Thurstone, dan distribusi eksponensial ganda. Jurnal Psikologi Matematika, 15 (2), 109-144.
Maddison, CJ, Mnih, A., & Teh, YW (2016). Distribusi Beton: Relaksasi Berkelanjutan dari Variabel Acak Acak. arXiv preprint arXiv: 1611.00712.
Jang, E., Gu, S., & Poole, B. (2016). Reparameterisasi Kategorikal dengan Gumbel-Softmax. arXiv preprint arXiv: 1611.01144.
Maddison, CJ (2016). Model proses Poisson untuk Monte Carlo. arXiv preprint arXiv: 1602.05986.
exp
dapat kehilangan presisi, yang mengarah ke distribusi seperti [1.0, 3.45e-66, 0.0, 7.54e-121] . Saya ingin bertahan untuk beberapa jawaban yang kuat bahkan dalam kasus itu. Tapi untuk saat ini, saya mengangkat jawaban Anda.