Apakah istilah fungsi kepadatan probabilitas dan distribusi probabilitas (atau hanya "distribusi") dapat dipertukarkan?

8

Seperti judulnya, apakah istilah fungsi densitas probabilitas dan distribusi probabilitas (atau hanya "distribusi") dapat dipertukarkan? Jika tidak, apa bedanya?

pdf
sumber
2
Dari keduanya, saya benar-benar berpikir ini adalah pertanyaan yang diajukan dengan lebih baik dalam banyak hal. Tetapi sebagai yang terakhir dari keduanya itu mungkin yang harus ditutup.
Silverfish
@ Silververfish Tidak hanya pertanyaan ini lebih baik dari yang lain, itu, menurut pendapat saya, menanyakan sesuatu yang berbeda. Memang, (tunggal dan diterima) jawaban untuk pertanyaan lainnya tidak menjawab pertanyaan ini sama sekali kecuali mungkin pada kalimat yang terakhir di dalamnya. Saya memilih untuk membukanya kembali; mungkin Anda bisa bergabung dengan saya dalam hal ini. Saya akan mengakui bahwa saya memiliki motif tersembunyi. Pertanyaan tertutup karena duplikat jarang dilihat oleh kebanyakan orang, dan saya tidak ingin membuang waktu untuk menulis jawaban di sini. Selain itu, memalukan untuk merampas kesenangan orang lain dari meremehkan jawaban polemik saya.
Dilip Sarwate
@Dilip Jika utas benar-benar duplikat, kami akan menggabungkannya, sehingga kontribusi Anda menjadi bagian dari utas asli. Namun dalam hal ini, saya setuju dengan pendapat Anda bahwa pertanyaannya cukup berbeda untuk menjamin pembukaan kembali utas ini.
whuber
@Dilip Jika ini tetap ditutup, salah satu pendekatan untuk meningkatkan visibilitas terkait tetapi tidak jawaban yang identik adalah dengan menghubungkan kembali ke sini melalui komentar dalam pertanyaan itu akan ditutup sebagai duplikat.
Glen_b -Reinstate Monica
Dapatkah seseorang tolong posting di sini tautan ke dup yang sebelumnya diusulkan?
kjetil b halvorsen

Jawaban:

5

Frasa fungsi kepadatan probabilitas (pdf) berarti hal tertentu: fungsi untuk variabel acak tertentu (untuk itulah diperlukan subskrip, untuk membedakan fungsi ini dari pdf dari variabel acak lainnya) dengan properti bahwa untuk semua bilangan real dan sedemikian sehingga , Integral yang berbeda dimaksudkan untuk berfungsi sebagai pengingat bahwa simbol apa pun yang kami gunakan sebagai argumen dari dan tidak penting.fX()XSebuahbSebuah<b

P{Sebuah<Xb}=SebuahbfX(kamu)dkamu=SebuahbfX(v)dv=SebuahbfX(t)dt.
fX()kasus (seperti yang sayangnya terlalu sering dipercaya oleh orang-orang yang memulai subjek ini) bahwa argumennya harus berupa huruf kecil yang sesuai dengan huruf besar yang menunjukkan variabel acak. Kami juga menegaskan bahwa Jika untuk beberapa bilangan real , maka tidak memiliki pdf kecuali untuk mereka yang memasukkan Dirac delta ke dalam kalkulus probabilitas mereka.
-fX(kamu)dkamu=1.
P{X=α}>0αX

The fungsi distribusi probabilitas kumulatif (CDF atau CDF) dari adalah fungsi yang didefinisikan sebagai Ini terkait dengan pdf (untuk fungsi yang memiliki pdf) melalui FX()X

FX(α)=P{Xα},-<α<.
FX(α)=-αfX(kamu)dkamu.

=======

Sementara mungkin ada definisi yang sangat ketat dari distribusi probabilitas frasa yang beberapa orang bersikeras, penggunaan sehari-hari dari istilah tersebut secara luas mencakup pdf dan CDF dan pmf (fungsi massa probabilitas yang juga disebut fungsi kepadatan ddf atau diskrit) dan apa pun yang kita mungkin ingin sertakan sebagai deskriptif perilaku probabilistik dari variabel acak. Misalnya, frasa

yang distribusi probabilitas dari seragam pada X(Sebuah,b)

tidak akan pernah diartikan sebagai makna bahwa CDF memiliki nilai konstan pada !! Meskipun adalah distribusi yang diduga menjadi seragam, semua orang di / waras nya akan menganggap itu sebagai yang berarti bahwa kepadatan dari memiliki nilai konstan pada interval (dan memiliki nilai tempat lain). Demikian pula, untuk " terdistribusi secara merata pada " ketika yang dimaksud adalah pdf dari memiliki nilai konstan pada .X(Sebuah,b) X(b-Sebuah)-1(Sebuah,b)0X(Sebuah,b)X(Sebuah,b)

Sebagai contoh lain dari penggunaan sehari-hari distribusi untuk kepadatan rata-rata , pertimbangkan kutipan ini dari jawaban yang baru - baru ini diposting oleh Moderator Glen_b.

"Mengatakan pada modus menyiratkan bahwa distribusi memiliki satu dan hanya satu."

Sebuah kepadatan mungkin memiliki modus yang unik tapi CDF tidak dapat memiliki modus yang unik (di real unextended). Namun, tidak ada yang membaca kutipan itu yang mungkin berpikir bahwa Glen_b berarti CDF ketika ia menulis "distribusi".

Dilip Sarwate
sumber
1
+1, tetapi saya memiliki beberapa keraguan tentang penekanan berbagai poin dalam jawaban ini. Poin terakhir bahwa PDF tidak didefinisikan secara unik - sebenarnya merupakan kelas fungsi ekuivalensi - mendukung pendapat yang berbeda bahwa "distribusi probabilitas" bahkan tidak secara bahasa merujuk ke PDF (kecuali sebagai penyalahgunaan terminologi). Jelas CDF, yang (tunduk pada pembatasan cadlag) adalah didefinisikan secara unik untuk semua variabel, merupakan kandidat yang jauh lebih baik untuk menjadi rujukan dari "distribusi" dari setiap variabel acak. L.1
whuber
1
@whuber Terima kasih telah membuka kembali pertanyaan dan upvote. Saya telah menghapus hal-hal variabel acak yang normal dan menggantinya dengan ilustrasi yang lebih baik tentang mengapa "distribusi" tidak selalu berarti CDF tetapi dapat menjadi standar untuk kepadatan atau pdf.
Dilip Sarwate
1
Dalam pengeditan, Anda membuat kasus yang sangat bagus atas nama interpretasi Anda tentang penggunaan sehari-hari.
whuber
2

Dalam hal penggunaan umum, pertimbangkan untuk menguraikan terminologi yang digunakan dalam R. Deskripsi pada halaman bantuan {stats} membantu mengatakan:

Kepadatan, fungsi distribusi kumulatif, fungsi kuantil, dan pembuatan variasi acak untuk banyak distribusi probabilitas standar tersedia dalam paket statistik.

Untuk setiap Distribusi built-in, ia menyediakan (sesuai dengan halaman bantuan individual) "kepadatan" (misalnya dnormuntuk Normal, dbinomuntuk Binomial) dan "fungsi distribusi" (misalnya, pnorm, pbinom, disebut "fungsi distribusi kumulatif" pada halaman Distribusi utama, seperti dikutip di atas).

Jadi orang mungkin menafsirkan bahwa "distribusi probabilitas" menggambarkan (mungkin anggota) keluarga distribusi, "kepadatan" dapat digunakan untuk distribusi terpisah seperti binomial, dan frase "fungsi distribusi" mungkin lebih disukai daripada "distribusi" ketika fungsi distribusi kumulatif adalah apa yang dimaksudkan.

Atau, orang mungkin berpendapat bahwa penggunaan umum bahkan di antara yang berpengalaman sering tergantung pada konteks untuk kejelasan.

EdM
sumber
0

Tidak.

  1. "fungsi kepadatan probabilitas" hanya digunakan untuk distribusi kontinu. Distribusi diskrit tidak dapat memiliki pdf (meskipun dapat diperkirakan dengan pdf). "distribusi probabilitas" sering digunakan untuk distribusi diskrit, misalnya, distribusi binomial.

  2. "distribusi probabilitas" memiliki arti untuk distribusi diskrit dan kontinu, tetapi distribusi probabilitas langsung berlaku hanya untuk distribusi diskrit. Ketika kata tersebut digunakan dengan distribusi kontinu, kata tersebut merujuk pada konstruk matematika yang mendasari seperti distribusi normal, yang harus untuk sebagian besar tujuan digunakan dalam fungsi, biasanya fungsi kepadatan probabilitas atau fungsi kepadatan kumulatif, sebelum dapat diterapkan.

Phil Goetz
sumber
1
"'distribusi probabilitas' biasanya digunakan untuk, dan hanya terdefinisi dengan baik untuk, distribusi diskrit" Apakah maksud Anda, misalnya, distribusi normal bukanlah distribusi probabilitas?
Juho Kokkala
@ Kokkala: Jika saya maksudkan itu, saya hanya akan mengatakan "'distribusi probabilitas' seharusnya hanya digunakan untuk distribusi diskrit." Kata-kata tambahan itu untuk memungkinkan kasus-kasus di mana orang memanggil mis. Distribusi normal distribusi probabilitas. Tetapi Anda mendapatkan poin yang bagus: dalam domain kontinu, "distribusi probabilitas" masih digunakan, tetapi untuk menerapkan distribusi probabilitas, kami harus menggunakan beberapa instantiasi yang lebih spesifik, seperti pdf atau cdf. Jadi saya akan mengubah jawaban saya jika saya bisa.
Phil Goetz
1
Ada definisi formal umum tentang "distribusi probabilitas" yang bertentangan dengan poin Anda (2); yaitu, distribusi dari setiap variabel acak bernilai nyataX diberikan oleh fungsi xPr(Xx). Ini jelas "langsung berlaku" untuk semua distribusi, bukan hanya yang terpisah.
Whuber
1
Fashions berubah pada ini. Fungsi massa probabilitas ekspresi diperkenalkan untuk membuat kasus diskrit benar-benar berbeda, tetapi sebaliknya banyak penulis menjelaskan bahwa kepadatan dapat didefinisikan sebagai kepadatan dalam hal ukuran penghitungan. Ini semua pertanyaan tentang ukuran yang mendasarinya. Jadi tidak; penulis yang kompeten dapat menulis fungsi kepadatan dan memiliki definisi yang luas dalam pikiran, bukan hanya penerapan pada variabel kontinu. Teks probabilitas menengah Peter Whittle adalah contohnya.
Nick Cox