Apa perbedaan makna antara notasi dan yang umum digunakan di banyak buku dan makalah?
probability
notation
Pelajar
sumber
sumber
Jawaban:
Saya percaya bahwa asal mula dari ini adalah paradigma kemungkinan (meskipun saya belum memeriksa kebenaran historis yang sebenarnya di bawah ini, ini adalah cara yang masuk akal untuk memahami bagaimana hal itu terjadi).
Katakanlah dalam pengaturan regresi, Anda akan memiliki distribusi: p (Y | x, beta) Yang berarti: distribusi Y jika Anda tahu (tergantung pada) nilai x dan beta.
Jika Anda ingin memperkirakan beta, Anda ingin memaksimalkan kemungkinan: L (beta; y, x) = p (Y | x, beta) Pada dasarnya, Anda sekarang melihat ekspresi p (Y | x, beta) sebagai fungsi beta, tetapi selain itu, tidak ada perbedaan (untuk ekspresi matematika yang benar yang dapat Anda peroleh dengan benar, ini adalah suatu keharusan --- meskipun dalam praktiknya tidak ada yang mengganggu).
Kemudian, dalam pengaturan bayesian, perbedaan antara parameter dan variabel lainnya segera memudar, sehingga Anda mulai menggunakan kedua notasi secara intermixedly.
Jadi, pada intinya: tidak ada perbedaan nyata: keduanya menunjukkan distribusi kondisional dari benda di sebelah kiri, bersyarat pada benda di sebelah kanan.
sumber
adalah kerapatan variabel acak X pada titik x , dengan θ menjadi parameter distribusi. f ( x , θ ) adalah kerapatan gabungan X dan Θ pada titik ( x , θ ) dan hanya masuk akal jika Θ adalah variabel acak. f ( x | θ ) adalah distribusi bersyarat dari X yang diberikan Θ , dan sekali lagi, hanya masuk akal jikaf(x;θ) X x θ f(x,θ) X Θ (x,θ) Θ f(x|θ) X Θ adalah variabel acak. Ini akan menjadi lebih jelas ketika Anda masuk lebih jauh ke dalam buku dan melihat analisis Bayesian.Θ
sumber
sumber
Meskipun tidak selalu seperti ini, hari ini umumnya digunakan ketika d , w bukan variabel acak (yang tidak mengatakan bahwa mereka dikenal, tentu saja). P ( z | d , w ) menunjukkan pengkondisian pada nilai d , w . Pengkondisian adalah operasi pada variabel acak dan dengan demikian menggunakan notasi ini ketika d , w bukan variabel acak yang membingungkan (dan tragisnya umum).P(z;d,w) d,w P(z|d,w) d,w d,w
Seperti yang ditunjukkan oleh @Nick Sabbe adalah notasi umum untuk distribusi sampling dari data yang diamati y . Beberapa frequentist akan menggunakan notasi ini tetapi bersikeras bahwa Θ bukan variabel acak, yang merupakan IMO penyalahgunaan. Tetapi mereka tidak memiliki monopoli di sana; Saya telah melihat orang Bayesian melakukannya juga, memasang hiperparameter tetap pada akhir kondisi.p(y|X,Θ) y Θ
sumber