Perbedaan antara model statistik dan model probabilitas?

29

Probabilitas terapan adalah cabang penting dalam probabilitas, termasuk probabilitas komputasi. Karena statistik menggunakan teori probabilitas untuk membangun model untuk menangani data, seperti pemahaman saya, saya bertanya-tanya apa perbedaan penting antara model statistik dan model probabilitas? Model probabilitas tidak memerlukan data nyata? Terima kasih.

Honglang Wang
sumber

Jawaban:

29

Sebuah Probabilitas Model terdiri dari triplet , di mana adalah ruang sampel, adalah -algebra (peristiwa) dan adalah ukuran probabilitas pada .Ω F σ P F(Ω,F,P)ΩFσPF

Penjelasan intuitif . Model probabilitas dapat diartikan sebagai variabel acak diketahui . Sebagai contoh, misalkan menjadi variabel acak yang terdistribusi normal dengan mean dan varians . Dalam hal ini ukuran probabilitas dikaitkan dengan Fungsi Distribusi Kumulatif (CDF) sampai X 0 1 PXX01PF

F(x)=P(Xx)=P(ωΩ:X(ω)x)=x12πexp(t22)dt.

Generalisasi . Definisi Model Probabilitas tergantung pada definisi matematika probabilitas, lihat misalnya probabilitas Gratis dan probabilitas Quantum .

Sebuah Model statistik adalah set model probabilitas, ini, serangkaian langkah-langkah probabilitas / distribusi pada ruang sampel . ΩSΩ

Seperangkat distribusi probabilitas ini biasanya dipilih untuk memodelkan fenomena tertentu yang darinya kami memiliki data.

Penjelasan intuitif . Dalam Model Statistik, parameter dan distribusi yang menggambarkan fenomena tertentu keduanya tidak diketahui. Contohnya adalah famili dari distribusi Normal dengan rata-rata dan varians , ini adalah, kedua parameter tidak diketahui dan Anda biasanya ingin menggunakan set data untuk memperkirakan parameter (yaitu memilih elemen ). Set distribusi ini dapat dipilih pada dan , tetapi, jika saya tidak salah, dalam contoh nyata hanya yang ditentukan pada pasangan yang sama masuk akal untuk mempertimbangkan. σ 2R + S Ω F ( Ω , F )μRσ2R+SΩF(Ω,F)

Generalisasi . Makalah ini memberikan definisi yang sangat formal Model Statistik, tetapi penulis menyebutkan bahwa "model Bayesian membutuhkan komponen tambahan dalam bentuk distribusi sebelumnya ... Meskipun formulasi Bayesian bukan fokus utama dari makalah ini". Oleh karena itu definisi Model Statistik tergantung pada jenis model yang kami gunakan: parametrik atau nonparametrik. Juga dalam pengaturan parametrik, definisi tergantung pada bagaimana parameter diperlakukan (misalnya Klasik vs Bayesian).

The Perbedaan adalah: dalam model probabilitas Anda tahu persis ukuran probabilitas, misalnya , di mana parameter diketahui, sementara dalam statistik. model yang Anda pertimbangkan kumpulan distribusi, misalnya , di mana adalah parameter yang tidak diketahui.μ 0 , σ 2 0 Normal ( μ , σ 2 ) μ , σ 2Normal(μ0,σ02)μ0,σ02Normal(μ,σ2)μ,σ2

Tidak satu pun dari mereka memerlukan set data, tetapi saya akan mengatakan bahwa model statistik biasanya dipilih untuk pemodelan satu.

Xi'an
sumber
2
@ HonglangWang Itu benar sampai batas tertentu. Perbedaan utama adalah bahwa model probabilitas hanya satu distribusi (dikenal), sedangkan model statistik adalah satu set model probabilitas; data digunakan untuk memilih model dari himpunan ini atau bagian yang lebih kecil dari model yang lebih baik (dalam arti tertentu) menggambarkan fenomena (dalam terang data).
2
(+1) Ini adalah jawaban yang bagus, meskipun saya punya beberapa komentar. Pertama, saya pikir ini mungkin menjual probabilist sedikit pendek. Sama sekali tidak jarang untuk mempertimbangkan seperangkat ruang probabilitas dalam model probabilistik, dan memang, langkah-langkah yang mungkin bahkan bisa acak (dibangun di ruang yang lebih besar sesuai). Kedua, seorang Bayesian (khususnya) mungkin menemukan jawaban ini sedikit membingungkan karena model statistik Bayesian sering dapat dilihat sebagai model probabilitas tunggal pada ruang produk yang sesuai . Ω×Θ
kardinal
1
@ung Ini pertanyaan yang lebih terkait dengan teori ukuran. Mengenai pertanyaan pertama Anda, memang didefinisikan melalui CDF. Sekarang, interpretasi Ω adalah yang sulit karena, secara formal, P ( X x ) berarti P ( ω Ω : X ( ω ) x ) , maka Ω bukan nilai yang dapat diamati. F adalah aljabar σ - yang merupakan pra-gambar dari Borel σ - aljabar di bawah XPΩP(Xx)P(ωΩ:X(ω)x)ΩFσσX, sekali lagi ini tidak dapat diamati. Saya tidak yakin bagaimana menjelaskan ini di tingkat intuitif.
2
@ung tergantung pada aplikasi ; itu tidak ditentukan oleh teori. Sebagai contoh, Ω bisa menjadi seperangkat gerakan Brown yang menggambarkan harga derivatif keuangan dan X bisa menjadi nilai yang diperoleh pada waktu yang tetap t . Di aplikasi lain Ω bisa berupa satu set orang dan X bisa menjadi panjang lengan mereka. Secara umum, Ω adalah model matematika dari objek fisik studi dan X adalah properti numerik dari objek tersebut. F adalah himpunan peristiwa yang mungkin: situasi-situasi yang ingin kita anggap sebagai probabilitas.ΩΩXtΩXΩXF
whuber
2
@gung adalah aljabar sigma : ini adalah kumpulan himpunan bagian ("acara"). Dalam aplikasi keuangan, ini adalah serangkaian sejarah harga; dalam aplikasi pengukuran lengan, acara akan menjadi set orang. Kami dapat membicarakan ini lebih banyak jika Anda ingin di ruang obrolan. F
whuber