Mengapa PDF Distribusi Dirichlet tampaknya tidak berintegrasi ke 1?

8

Saya telah mencoba untuk menemukan nilai yang diharapkan dari fungsi variabel acak dengan distribusi Dirichlet dengan mengintegrasikan produknya dengan fungsi kepadatan Dirichlet melalui simpleks dalam R.

Untuk memeriksa saya menerapkan fungsi yang benar dalam R, saya mencoba mengintegrasikan fungsi kerapatan pada seluruh simpleks, berharap untuk mendapatkan 1, namun saya terus mendapatkan bahwa fungsi kerapatan untuk distribusi Dirichlet dengan n kategori yang terintegrasi ke sqrt (n) (menggunakan Paket R SimplicialCubature).

Saya berasumsi ini pasti salah, tapi kemudian saya melihat fungsi kerapatan untuk 2 kategori, perhatikan kasus di mana alfa = (1,1). Kemudian fungsi kerapatan seragam 1 (mengambil fungsi kerapatan dari https://en.wikipedia.org/wiki/Dirichlet_distribution ). Jadi integral dari fungsi densitas atas 1-simpleks hanya memberikan panjang 1-simpleks. Tapi ini sqrt (2), seperti yang saya temukan dengan kode R.

Apa yang kulewatkan di sini?

EBartrum
sumber

Jawaban:

12

Dengan dua variabel, Anda mendefinisikan segmen garis di , seperti yang Anda tunjukkan. Namun, karena kendala simpleks, salah satu dari dua variabel ini berlebihan dalam hal menentukan kepadatan, karena ada hubungan satu-ke-satu antara dan . Oleh karena itu, kepadatan ditentukan lebih dari variabel bebas (yaitu, dalam )R2x1x2K-1R

Ini sebenarnya ditunjukkan pada baris pertama bagian artikel Wikipedia ini, meskipun sangat halus.

Karena itu, fungsi kepadatan Anda menjadi :.

Dir1,1(x1,1x1)=Γ(2)Γ(1)2(x1)0(1x1)0=1

Karena itu,

01Dsayar1,1(x1,1-x1)dx1=1

Respon untuk Komentar OP

Karena kendala simpleks, kepadatan Dirichlet dua variabel sebenarnya merosot dalam , seperti yang ditunjukkan oleh konstruksi saya di atas (hanya membutuhkan satu variabel). Meskipun benar ia memiliki kerapatan , ia tidak memiliki kerapatanR211 pada segmen yang terhubung (1,0) dengan (0,1). Apa yang ditunjukkan oleh konstruksi di atas adalah bahwa kepadatan marginal memiliki nilai1. Kebingungan Anda berasal dari pemikiranx2 sebagai variabel bebas, dalam hal ini dukungan Dirichlet aktif R2akan memiliki area yang tidak nol. Intuisi ini baik-baik saja dalam kasus-kasus seperti gaussian bivariat, di mana kedua variabel tidak berkorelasi sempurna, tetapi tidak dalam kasus ini.

Kami dapat memperoleh ini secara resmi sebagai berikut:

Membiarkan L. ada beberapa nomor dalam [0,2] menentukan jarak dari (1,0) untuk (0,1)sepanjang segmen jalur penghubung. Dengan demikian, setiap nilaiL. mengidentifikasi yang unik (x1,x2)pasangan. Dengan menggunakan notasi ini, asumsi Anda bahwa kepadatannya adalah1 sepanjang garis ini bermuara ke:

P(L.[Sebuah,b])=b-Sebuah

Namun, kami dapat menunjukkan ini tidak terjadi melalui perawatan formal dari kepadatan sendi x1,x2:

PL.(L.[Sebuah,b])=PX1,X2[(x1,x2)SEBUAH[Sebuah,b]]

Dimana SEBUAH[Sebuah,b]: ={(kamu,v):kamu[1-b2,1-Sebuah2],v=1-kamu]

Sekarang, mari kita hitung PL.(L.[Sebuah,b]):

PL.(L.[Sebuah,b])=SEBUAH[Sebuah,b]dPX1,X2=SEBUAH[Sebuah,b]dPX1dPX2|X1=SEBUAH[Sebuah,b]1dPX1=1-b21-Sebuah21dkamu=

(1-Sebuah2)-(1-b2)=12(b-Sebuah)

Di mana kesetaraan ketiga muncul karena dPX2|X1=1 untuk X2=1-X1 (Yaitu, itu bukan kepadatan, tetapi massa probabilitas titik di 1-X1)

Seperti yang Anda lihat, kami telah memulihkan 12 menormalkan konstanta untuk densitas sepanjang segmen garis dalam R2. Secara efektif, kerapatan sambungan ini (degenerasi) hanyalah transformasi linear dari salah satu dari dua marjinal (salah satu akan bekerja). Ini menghasilkan domain dari probabilitas kepadatan untuk pergi1 untuk 2, maka kerapatan harus berkurang untuk mengimbangi.


sumber
1
Banyak terima kasih, saya setuju dengan logika dari apa yang telah Anda tulis, tetapi saya tidak dapat menyamakannya dalam pikiran saya dengan fakta bahwa fungsi tersebut memiliki nilai konstan 1 dan garis memiliki panjang sqrt (2). Jadi mengapa tidak terpisahkan memberi sqrt (2) ??
EBartrum
@EBartrum Saya akan menambahkan beberapa klarifikasi sekitar 7:30 EDT
3
@EBartrum menambahkan beberapa detail untuk melengkapi postingan (Saya tahu Anda sudah menerima, tetapi yang lain mungkin menginginkan detail tambahan)