Sebuah Probabilitas Model terdiri dari triplet , di mana adalah ruang sampel, adalah -algebra (peristiwa) dan adalah ukuran probabilitas pada .Ω F σ P F( Ω , F, P )ΩFσPF
Penjelasan intuitif . Model probabilitas dapat diartikan sebagai variabel acak diketahui . Sebagai contoh, misalkan menjadi variabel acak yang terdistribusi normal dengan mean dan varians . Dalam hal ini ukuran probabilitas dikaitkan dengan Fungsi Distribusi Kumulatif (CDF) sampai X 0 1 PXX01PF
F( x ) = P ( X≤ x ) = P ( ω ∈ Ω : X( ω ) ≤ x ) = ∫x- ∞12 π--√exp( - t22) dt .
Generalisasi . Definisi Model Probabilitas tergantung pada definisi matematika probabilitas, lihat misalnya probabilitas Gratis dan probabilitas Quantum .
Sebuah Model statistik adalah set model probabilitas, ini, serangkaian langkah-langkah probabilitas / distribusi pada ruang sampel . ΩSΩ
Seperangkat distribusi probabilitas ini biasanya dipilih untuk memodelkan fenomena tertentu yang darinya kami memiliki data.
Penjelasan intuitif . Dalam Model Statistik, parameter dan distribusi yang menggambarkan fenomena tertentu keduanya tidak diketahui. Contohnya adalah famili dari distribusi Normal dengan rata-rata dan varians , ini adalah, kedua parameter tidak diketahui dan Anda biasanya ingin menggunakan set data untuk memperkirakan parameter (yaitu memilih elemen ). Set distribusi ini dapat dipilih pada dan , tetapi, jika saya tidak salah, dalam contoh nyata hanya yang ditentukan pada pasangan yang sama masuk akal untuk mempertimbangkan. σ 2 ∈ R + S Ω F ( Ω , F )μ ∈ Rσ2∈ R+SΩF(Ω,F)
Generalisasi . Makalah ini memberikan definisi yang sangat formal Model Statistik, tetapi penulis menyebutkan bahwa "model Bayesian membutuhkan komponen tambahan dalam bentuk distribusi sebelumnya ... Meskipun formulasi Bayesian bukan fokus utama dari makalah ini". Oleh karena itu definisi Model Statistik tergantung pada jenis model yang kami gunakan: parametrik atau nonparametrik. Juga dalam pengaturan parametrik, definisi tergantung pada bagaimana parameter diperlakukan (misalnya Klasik vs Bayesian).
The Perbedaan adalah: dalam model probabilitas Anda tahu persis ukuran probabilitas, misalnya , di mana parameter diketahui, sementara dalam statistik. model yang Anda pertimbangkan kumpulan distribusi, misalnya , di mana adalah parameter yang tidak diketahui.μ 0 , σ 2 0 Normal ( μ , σ 2 ) μ , σ 2Normal(μ0,σ20)μ0,σ20Normal(μ,σ2)μ,σ2
Tidak satu pun dari mereka memerlukan set data, tetapi saya akan mengatakan bahwa model statistik biasanya dipilih untuk pemodelan satu.