Pengambilan sampel dari distribusi marjinal menggunakan distribusi bersyarat?

12

Saya ingin sampel dari kepadatan univariat tapi saya hanya tahu hubungannya:fX

fX(x)=fX|Y(x|y)fY(y)dy.

Saya ingin menghindari penggunaan MCMC (langsung pada representasi integral) dan, karena dan mudah untuk diambil sampelnya, saya berpikir untuk menggunakan sampler berikut :fX|Y(x|y)fY(y)

  1. Untuk .j=1,,N
  2. Contoh .yjfY
  3. Contoh .xjfX|Y(|yj)

Kemudian, saya akan berakhir dengan pasangan , dan hanya mengambil sampel marjinal . Apakah ini benar?(x1,y1),...,(xN,yN)(x1,,xN)

tongkat
sumber

Jawaban:

10

Ya ini benar. Pada dasarnya kamu punya

fX,Y(x,y)=fX|Y(x|y)fY(y),

dan seperti yang Anda katakan, Anda dapat mencicipi dari kerapatan sambungan. Mengambil hanya s dari sampel membawa Anda ke sampel dari distribusi marjinal.x

Ini karena tindakan mengabaikan mirip dengan mengintegrasikannya. Mari kita pahami ini dengan sebuah contoh.y

Misalkan = Tinggi ibu dan = Tinggi anak perempuan. Tujuannya adalah untuk mendapatkan sampel dari untuk memahami hubungan antara ketinggian anak perempuan dan ibu mereka. (Saya membuat asumsi bahwa hanya ada satu anak perempuan dalam keluarga, dan membatasi populasi untuk semua anak perempuan di atas usia 18 tahun untuk memastikan pertumbuhan penuh).XY(X,Y)

Anda keluar dan mendapatkan sampel yang representatif

(x1,y1),,(xN,yN).

Jadi untuk setiap ibu, Anda memiliki tinggi anak mereka. Harus ada hubungan yang jelas antara dan . Sekarang misalkan dari dataset Anda, Anda mengabaikan semua data pada putri (drop ), lalu apa yang Anda miliki? Anda memiliki persis ketinggian ibu yang dipilih secara acak yang akan menarik dari marjinal .XYYNX

Greenparker
sumber
Terima kasih untuk ini, ini sangat membantu. Apakah Anda tahu jika strategi pengambilan sampel ini dapat dikaitkan dengan pengambilan sampel Gibbs untuk membenarkannya secara formal?
Rod
1
Jika Anda dapat mengambil sampel dari distribusi bersama dengan mudah, maka abaikan untuk mendapatkan marginal untuk tidak perlu pembenaran. Itu adalah hal yang biasa dilakukan. Mungkin, Anda dapat mengatakan bahwa adalah variabel Linchpin , tetapi karena Anda tidak perlu sampel Gibbs untuk mengambil sampel dari , tidak perlu untuk MCMC di sini. yxyy
Greenparker
1
Greenparker, tetapi adakah bukti formal dari pernyataan itu, yaitu dengan mempertimbangkan hanya sebagian sampel yang diambil dari sambungan yang memberikan sampel dari marginal?
Seorang pria tua di laut.
Pengambilan sampel "X = ibu" dengan pengambilan sampel (X, Y) dan pengambilan X sebenarnya memberi Anda sampel "ibu yang memiliki satu anak perempuan dewasa", yang tidak sama dengan "ibu". Tetapi bahkan jika kami mengubah contoh Anda untuk mengatakan bahwa Anda tertarik pada "X = ibu yang memiliki satu anak perempuan yang sudah dewasa", mendapatkan X dengan mengambil sampel (X, Y) mengubah sampel Anda berdasarkan distribusi Y. p (v ) = ∑ (u dalam dukungan (U)) (p (u, v))) = ∑ (u dalam dukungan (U)) (p (v | u) * p (u))) = (1 / sampleSize ( u)) * β (u dalam sampel (U)) (p (v | u))), karena setiap nilai u muncul dalam sampel dengan probabilitas p (u) - jadi perlu rata-rata p (v | u) menarik
radumanolescu