Dalam Pengenalan Pola Bishop dan Pembelajaran Mesin saya membaca yang berikut, tepat setelah kerapatan probabilitas diperkenalkan:
Di bawah perubahan variabel nonlinier, kepadatan probabilitas berubah secara berbeda dari fungsi sederhana, karena faktor Jacobian. Sebagai contoh, jika kita mempertimbangkan perubahan variabel , maka fungsi menjadi . Sekarang pertimbangkan kepadatan probabilitas yang sesuai dengan kepadatan sehubungan dengan variabel baru , di mana suf fi ces menunjukkan fakta bahwa dan adalah kepadatan yang berbeda. Pengamatan yang jatuh dalam kisaran akan, untuk nilai-nilai kecil dari , ditransformasikan ke dalam kisaran ) di mana , dan karenanya p_y (y) = p_x (x) | \ frac {dx} {dy} | = p_x (g (y)) | g \ prime (y) | .
Apa faktor Jacobian dan apa sebenarnya arti semuanya (mungkin secara kualitatif)? Bishop mengatakan, bahwa konsekuensi dari sifat ini adalah bahwa konsep maksimum dari kepadatan probabilitas tergantung pada pilihan variabel. Apa artinya ini?
Bagi saya ini tiba-tiba muncul sedikit (mengingat itu ada di bab pendahuluan). Saya menghargai beberapa petunjuk, terima kasih!
Jawaban:
Saya sarankan Anda membaca solusi dari Pertanyaan 1.4 yang memberikan intuisi yang baik.
Singkatnya, jika Anda memiliki fungsi sewenang-wenang dan dua variabel dan yang saling terkait dengan fungsi , maka Anda dapat menemukan maksimum fungsi baik dengan langsung menganalisis : atau fungsi yang ditransformasikan : . Tidak mengherankan, dan akan terkait dengan masing-masing sebagai (di sini saya berasumsi bahwa .x y x = g ( y ) f ( x ) x = a r g m a x x ( f ( x ) ) f ( g ( y ) ) y = a r g m a x y ( f ( g ( y ) ) x yf( x ) x y x = g( y) f( x ) x^= a r gm a xx( f( x ) ) f( g( y) ) y^= a r gm a xy( f( g( y) ) x^ y^ ∀y:g'(y)≠0)x^=g(y^) ∀y:g′(y)≠0)
Ini bukan kasus untuk distribusi probabilitas. Jika Anda memiliki distribusi probabilitas dan dua variabel acak yang terkait satu sama lain oleh . Maka tidak ada hubungan langsung antara dan . Ini terjadi karena faktor Jacobian, faktor yang menunjukkan bagaimana volume relatif diubah oleh fungsi seperti .x = g ( y ) x = a r g m a x x ( p x ( x ) ) y = a r g m a x y ( p y ( y ) ) g ( . )px(x) x=g(y) x^=argmaxx(px(x)) y^=argmaxy(py(y)) g(.)
sumber