Apakah Wolfram Mathworld membuat kesalahan dengan menggambarkan distribusi probabilitas diskrit dengan fungsi kepadatan probabilitas?

14

Biasanya distribusi probabilitas lebih dari variabel diskrit dijelaskan menggunakan probabilitas fungsi massa (PMF):

Ketika bekerja dengan variabel acak kontinu, kami menggambarkan distribusi probabilitas menggunakan probabilitas probabilitas fungsi (PDF) daripada fungsi massa probabilitas.

- Pembelajaran Jauh oleh Goodfellow, Bengio, dan Courville

Namun, Wolfram Mathworld menggunakan PDF untuk menggambarkan distribusi probabilitas lebih dari variabel diskrit:

masukkan deskripsi gambar di sini

Apakah ini sebuah kesalahan? atau tidak masalah?

czlsws
sumber
5
Itu ceroboh, menurut saya, tetapi tidak terlalu penting. Bahkan dapat dipertahankan jika mereka mendekati probabilitas dari sudut pandang teori ukuran, meskipun itu sepertinya sedikit banyak untuk pengantar membalik koin. (Cukup aneh, mereka tampaknya tidak memiliki artikel tentang PMF).
Dave
9
PMF adalah kepadatan terhadap ukuran penghitungan
Xi'an
3
Ketika Anda membahas teori probabilitas pada tingkat ukuran ruang yang ditentukan oleh 3 elemen, pdf dan PMF tidak berbeda, sehingga PMF dijatuhkan. Semua distribusi dapat ditentukan oleh pdf. wolfram adalah situs web matematika, jadi tidak mengherankan jika mereka menggunakan matematika tingkat tinggi untuk berbicara tentang probabilitas. Ini bacaan gratis yang bagus. stat.washington.edu/~pdhoff/courses/581/LectureNotes/…
user158565

Jawaban:

30

Ini bukan kesalahan: Dalam pengobatan formal probabilitas, melalui teori ukuran, fungsi kepadatan probabilitas adalah turunan dari ukuran probabilitas bunga, diambil sehubungan dengan "ukuran mendominasi" (juga disebut "ukuran referensi"). Untuk distribusi diskrit di atas bilangan bulat, fungsi massa probabilitas adalah fungsi kerapatan sehubungan dengan ukuran penghitungan . Karena fungsi massa probabilitas adalah tipe tertentu dari fungsi kerapatan probabilitas, Anda kadang-kadang akan menemukan referensi seperti ini yang menyebutnya sebagai fungsi kerapatan, dan mereka tidak salah menyebutnya dengan cara ini.

Dalam wacana biasa tentang probabilitas dan statistik, orang sering menghindari terminologi ini, dan menarik perbedaan antara "fungsi massa" (untuk variabel acak diskrit) dan "fungsi kepadatan" (untuk variabel acak kontinu), untuk membedakan distribusi diskrit dan kontinu. Dalam konteks lain, di mana seseorang menyatakan aspek probabilitas holistik, seringkali lebih baik untuk mengabaikan perbedaan dan merujuk keduanya sebagai "fungsi kepadatan".

Pasang kembali Monica
sumber
Terima kasih atas jawaban anda. Apakah treatment"Dalam perlakuan formal tentang probabilitas" berarti notasi, perspektif, konvensi, atau sesuatu yang lain?
czlsws
Ketika saya berbicara di sini tentang "perlakuan formal", saya merujuk pada dasar modern teori probabilitas, yang merupakan subset dari teori ukuran. Itu adalah teori matematika yang diterima sebagai dasar formal probabilitas.
Pasang kembali Monica
"fungsi kepadatan probabilitas adalah turunan dari ukuran probabilitas bunga" Sepertinya bagi saya dalam beberapa hal ini lebih merupakan "anti-integral" daripada turunan. Ada PDF terputus-putus, seperti distribusi seragam, dan distribusi diskrit dapat diperlakukan sebagai jumlah dari fungsi Dirac delta. Dalam kasus-kasus itu, seseorang harus menggeneralisasi konsep turunan yang jauh melampaui pemahaman biasa agar dapat diterapkan.
Akumulasi
@Akumulasi - bagaimana distribusi seragam terputus? ... dan mengukur teori adalah perlakuan yang jauh lebih umum dari integrasi dan diferensiasi daripada pemahaman biasa dari Calc I dan II.
jbowman
@Akumulasi: Ya, itu penokohan yang adil, dan memang, itulah yang dilakukan. Secara teknis kepadatan adalah turunan Radon-Nikodym , yang memang merupakan jenis "anti-integral" dari jenis yang Anda gambarkan.
Pasang kembali Monica
5

Selain jawaban yang lebih teoretis dalam hal teori ukuran, juga lebih mudah untuk tidak membedakan antara PMFS dan PDF dalam pemrograman statistik. Misalnya, R memiliki banyak distribusi bawaan. Untuk setiap distribusi, ia memiliki 4 fungsi. Misalnya, untuk distribusi normal (dari file bantuan):

dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.

Pengguna R dengan cepat menjadi d,p,q,rterbiasa dengan awalan. Akan menyebalkan jika Anda harus melakukan sesuatu seperti drop dand use muntuk misal distribusi binomial. Alih-alih, semuanya seperti yang diharapkan pengguna R:

dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.
John Coleman
sumber
3
scipy.statsYang membedakan, beberapa objek memiliki pdfmetode dan yang lain memiliki pmfmetode. Itu benar-benar mengganggu saya!
Matthew Drury