Saya membaca dari sebuah buku yang memperkenalkan distribusi Dirchilet dan kemudian mempresentasikan angka-angka tentangnya. Tetapi saya tidak benar-benar dapat memahami angka-angka itu. Saya lampirkan gambar di sini di bagian bawah. Yang tidak saya mengerti adalah arti dari segitiga.
Biasanya ketika seseorang ingin memplot fungsi 2 variabel, Anda mengambil nilai var1 dan va2 dan kemudian memplot nilai nilai fungsi dari dua variabel ... yang memberikan visualisasi dalam dimensi 3D. Tapi di sini ada 3 dimensi dan satu nilai lainnya untuk nilai fungsi sehingga membuat visualisasi dalam ruang 4D. Saya tidak bisa mengerti angka-angka itu!
Saya harap seseorang dapat menjelaskannya!
EDIT: di sini adalah apa yang saya tidak mengerti dari gambar 2.14a. Jadi kita telah mengambil dari K = 3 dirichlet sampel theta (yang pada dasarnya adalah vektor) yaitu: theta = [theta1, theta2, theta3]. Plot segitiga [theta1, theta2, theta3]. Jarak dari asal ke masing-masing theta_i adalah nilai theta_i. Kemudian untuk setiap theta_i itu meletakkan sebuah vertex dan menghubungkan ketiga verteces dan membuat segitiga. Saya tahu bahwa jika saya memasukkan [theta1, theta2, theta3] ke dir (theta | a) saya akan mendapatkan satu angka yang merupakan probabilitas gabungan dari vektor theta. Saya juga mengerti bahwa probabilitas untuk variabel acak kontinu adalah ukuran suatu area. Tapi di sini kita memiliki 3 dimensi sehingga probabilitas gabungan akan menjadi ukuran volume ruang dari bidang merah muda dan di bawah ... yaitu piramida. Sekarang saya tidak mengerti apa peran segitiga di sini.
Jawaban:
Semua titik dalam segitiga harus memenuhi dua batasan: antara nol dan satu di setiap dimensi ( ) dan semua jumlah hingga satu ( ).θ 0 + θ 1 + θ 2 = 10 ≤ θ ≤ 1 θ0+ θ1+ θ2= 1
Cara saya akhirnya memahaminya adalah sebagai berikut:
Jadi (a) menunjukkan ruang 3-D dengan sebagai koordinat. Mereka hanya berkisar antara 0 dan 1.θ1 , 2 , 3
Dalam (b), sebuah segitiga ditampilkan, ini adalah simpleks kami.
(C) menunjukkan dua contoh poin yang "meletakkan" pada simpleks yang juga memenuhi kriteria kedua (jumlah hingga satu).
(D) menunjukkan titik contoh lain pada simpleks, kendala yang sama berlaku
Dalam (e), saya mencoba menampilkan proyeksi simpleks ke segitiga 2-D dengan semua titik contoh yang ditunjukkan sebelumnya.
Semoga lebih masuk akal sekarang :)
sumber
Grafik 2.14 (a) menunjukkan bidang yang dibuat oleh tiga simpul pada setiap sumbu. Jarak dari titik asal adalah , sesuai dengan salah satu dari kelas. Wilayah yang dilingkupi oleh bidang merah muda dan bidang sumbu adalah probabilitas (vektor) k = 3 θθi k=3 θ . Sekarang anggaplah Anda memiringkan bidang itu sehingga Anda memiliki piramida dengan bidang merah muda, wajah terdekat dengan pembaca, ditempatkan rata pada halaman. Lalu tekan dimensi ketiga "muncul" dari halaman, dan bukannya warna segitiga sehingga daerah kepadatan yang lebih tinggi, dengan jarak yang lebih panjang dari alas ke permukaan, lebih merah. Itulah yang ditunjukkan grafik 2.14 (b) dan 2.14 (c). Semakin merah terkonsentrasi di dekat sebuah titik, semakin besar kemungkinan kelas yang terkait dengan titik itu. Demikian juga, jika wilayah merah tidak terlalu dekat dengan titik mana pun, kemungkinan besar suatu peristiwa memiliki kemungkinan keanggotaan yang lebih tinggi di salah satu kelas.
Piramida ini, bagaimanapun, hanya masuk akal sebagai realisasi tunggal dari distribusi Dirichlet. Menggambar lagi dari distribusi yang sama dapat menghasilkan piramida yang berbeda dengan panjang berbeda untuk masing-masing simpul. Perbedaan utama antara (a) dan (b) / (c) adalah bahwa (a) secara grafis menampilkan probabilitas satu gambar vektor . Grafik (b) dan (c) menunjukkan kepadatan probabilitas untuk nilai dalam simpleks , yaitu, mereka berusaha menyajikan fungsi kepadatan probabilitas untuk semua nilaiθ θ k = 3 θ θ ∼ Dir ( α )θ θ θ k=3 θ dalam dukungan. Salah satu cara untuk berpikir tentang (b) dan (c) adalah sebagai titik yang memiliki warna merah tambahan sesuai dengan tinggi rata-rata antara bidang datar berwarna merah muda dan permukaan piramida, rata-rata di atas banyak gambar .θ∼Dir(α)
sumber