Ya ini benar. Pada dasarnya kamu punya
fX,Y(x,y)=fX|Y(x|y)fY(y),
dan seperti yang Anda katakan, Anda dapat mencicipi dari kerapatan sambungan. Mengambil hanya s dari sampel membawa Anda ke sampel dari distribusi marjinal.x
Ini karena tindakan mengabaikan mirip dengan mengintegrasikannya. Mari kita pahami ini dengan sebuah contoh.y
Misalkan = Tinggi ibu dan = Tinggi anak perempuan. Tujuannya adalah untuk mendapatkan sampel dari untuk memahami hubungan antara ketinggian anak perempuan dan ibu mereka. (Saya membuat asumsi bahwa hanya ada satu anak perempuan dalam keluarga, dan membatasi populasi untuk semua anak perempuan di atas usia 18 tahun untuk memastikan pertumbuhan penuh).XY(X,Y)
Anda keluar dan mendapatkan sampel yang representatif
(x1,y1),…,(xN,yN).
Jadi untuk setiap ibu, Anda memiliki tinggi anak mereka. Harus ada hubungan yang jelas antara dan . Sekarang misalkan dari dataset Anda, Anda mengabaikan semua data pada putri (drop ), lalu apa yang Anda miliki? Anda memiliki persis ketinggian ibu yang dipilih secara acak yang akan menarik dari marjinal .XYYNX