Arti mewakili simpleks sebagai permukaan segitiga dalam distribusi Dirichlet?

9

Saya membaca dari sebuah buku yang memperkenalkan distribusi Dirchilet dan kemudian mempresentasikan angka-angka tentangnya. Tetapi saya tidak benar-benar dapat memahami angka-angka itu. Saya lampirkan gambar di sini di bagian bawah. Yang tidak saya mengerti adalah arti dari segitiga.

Biasanya ketika seseorang ingin memplot fungsi 2 variabel, Anda mengambil nilai var1 dan va2 dan kemudian memplot nilai nilai fungsi dari dua variabel ... yang memberikan visualisasi dalam dimensi 3D. Tapi di sini ada 3 dimensi dan satu nilai lainnya untuk nilai fungsi sehingga membuat visualisasi dalam ruang 4D. Saya tidak bisa mengerti angka-angka itu!

Saya harap seseorang dapat menjelaskannya!

EDIT: di sini adalah apa yang saya tidak mengerti dari gambar 2.14a. Jadi kita telah mengambil dari K = 3 dirichlet sampel theta (yang pada dasarnya adalah vektor) yaitu: theta = [theta1, theta2, theta3]. Plot segitiga [theta1, theta2, theta3]. Jarak dari asal ke masing-masing theta_i adalah nilai theta_i. Kemudian untuk setiap theta_i itu meletakkan sebuah vertex dan menghubungkan ketiga verteces dan membuat segitiga. Saya tahu bahwa jika saya memasukkan [theta1, theta2, theta3] ke dir (theta | a) saya akan mendapatkan satu angka yang merupakan probabilitas gabungan dari vektor theta. Saya juga mengerti bahwa probabilitas untuk variabel acak kontinu adalah ukuran suatu area. Tapi di sini kita memiliki 3 dimensi sehingga probabilitas gabungan akan menjadi ukuran volume ruang dari bidang merah muda dan di bawah ... yaitu piramida. Sekarang saya tidak mengerti apa peran segitiga di sini.

masukkan deskripsi gambar di sini

Jack Twain
sumber
2
Saya sarankan Anda mulai dari distribusi beta dan bekerja dari sana. The Dirichlet for 3 adalah "just" ekstensi logis dari beta, yang merupakan Dirichlet for 2.
Andris Birkmanis
Lihat utas ini untuk contoh: stats.stackexchange.com/questions/244917/…
Tim
Sangat membantu untuk berpikir bahwa distribusi Beta ditunjukkan dalam 2D ​​(sumbu x mewakili hasil biner {0,1} dan sumbu y mewakili probabilitas) sehingga hasil ternary memerlukan dimensi ekstra, bukan?
George

Jawaban:

4

Saya tidak mengerti apa peran segitiga di sini. Apa yang ia coba komunikasikan atau visualisasikan?

Semua titik dalam segitiga harus memenuhi dua batasan: antara nol dan satu di setiap dimensi ( ) dan semua jumlah hingga satu ( ).θ 0 + θ 1 + θ 2 = 10θ1θ0+θ1+θ2=1

Cara saya akhirnya memahaminya adalah sebagai berikut:

angka

Jadi (a) menunjukkan ruang 3-D dengan sebagai koordinat. Mereka hanya berkisar antara 0 dan 1.θ1,2,3

Dalam (b), sebuah segitiga ditampilkan, ini adalah simpleks kami.

(C) menunjukkan dua contoh poin yang "meletakkan" pada simpleks yang juga memenuhi kriteria kedua (jumlah hingga satu).

(D) menunjukkan titik contoh lain pada simpleks, kendala yang sama berlaku

Dalam (e), saya mencoba menampilkan proyeksi simpleks ke segitiga 2-D dengan semua titik contoh yang ditunjukkan sebelumnya.

Semoga lebih masuk akal sekarang :)

John Doe
sumber
2
Foto yang bagus. Apakah ini milikmu? Jika tidak, dapatkah Anda memberikan referensi dan sumbernya?
Tim
1
Terima kasih. Itu milik saya (digambar menggunakan Inkscape), saya dapat memberikan SVG jika diperlukan ...
John Doe
2

Grafik 2.14 (a) menunjukkan bidang yang dibuat oleh tiga simpul pada setiap sumbu. Jarak dari titik asal adalah , sesuai dengan salah satu dari kelas. Wilayah yang dilingkupi oleh bidang merah muda dan bidang sumbu adalah probabilitas (vektor) k = 3 θθik=3θ. Sekarang anggaplah Anda memiringkan bidang itu sehingga Anda memiliki piramida dengan bidang merah muda, wajah terdekat dengan pembaca, ditempatkan rata pada halaman. Lalu tekan dimensi ketiga "muncul" dari halaman, dan bukannya warna segitiga sehingga daerah kepadatan yang lebih tinggi, dengan jarak yang lebih panjang dari alas ke permukaan, lebih merah. Itulah yang ditunjukkan grafik 2.14 (b) dan 2.14 (c). Semakin merah terkonsentrasi di dekat sebuah titik, semakin besar kemungkinan kelas yang terkait dengan titik itu. Demikian juga, jika wilayah merah tidak terlalu dekat dengan titik mana pun, kemungkinan besar suatu peristiwa memiliki kemungkinan keanggotaan yang lebih tinggi di salah satu kelas.

Piramida ini, bagaimanapun, hanya masuk akal sebagai realisasi tunggal dari distribusi Dirichlet. Menggambar lagi dari distribusi yang sama dapat menghasilkan piramida yang berbeda dengan panjang berbeda untuk masing-masing simpul. Perbedaan utama antara (a) dan (b) / (c) adalah bahwa (a) secara grafis menampilkan probabilitas satu gambar vektor . Grafik (b) dan (c) menunjukkan kepadatan probabilitas untuk nilai dalam simpleks , yaitu, mereka berusaha menyajikan fungsi kepadatan probabilitas untuk semua nilaiθ θ k = 3 θ θ Dir ( α )θθθk=3θdalam dukungan. Salah satu cara untuk berpikir tentang (b) dan (c) adalah sebagai titik yang memiliki warna merah tambahan sesuai dengan tinggi rata-rata antara bidang datar berwarna merah muda dan permukaan piramida, rata-rata di atas banyak gambar .θDir(α)

Sycorax berkata Reinstate Monica
sumber
Beberapa poin masih belum jelas. Mungkin karena bahasa Inggrisku yang lemah. "Wilayah yang dikelilingi oleh pesawat merah muda dan bidang kapak adalah kepadatan." Apakah itu ruang kosong piramida di bawah bidang pink? Juga "kepadatan"? Apa maksudmu? Seperti yang saya pahami adalah bahwa dir (x1, x2, x3) adalah satu nilai, bagaimana kepadatan di sini masuk ke grafik?
Jack Twain
Ya, antara bidang merah muda dan pesawat yang dibentuk oleh garis-garis hitam di 2,14 (a) adalah ruang piramida yang saya coba gambarkan. Maaf bila membingungkan!
Sycorax berkata Reinstate Monica
Saya akan mengedit posting saya untuk menjelaskan lebih lanjut apa yang masih belum jelas
Jack Twain
masalahnya adalah wilayah merah muda persis dukungan yang dijelaskan dalam buku ini. sejak theta_k <= 1 dan jumlah (theta_k) = 1. Setelah Anda membayangkannya, user777 sepenuhnya benar.
Gores
@ user777 Saya baru saja mengedit posting
Jack Twain