Apakah pdf dan PMF dan cdf berisi informasi yang sama?

17

Apakah pdf dan PMF dan cdf berisi informasi yang sama?

Bagi saya pdf memberikan seluruh probabilitas ke titik tertentu (pada dasarnya area di bawah probabilitas).

PMF memberikan probabilitas titik tertentu.

Cdf memberikan probabilitas di bawah titik tertentu.

Jadi bagi saya pdf dan cdf memiliki informasi yang sama, tetapi PMF tidak karena memberikan kemungkinan untuk titik xdistribusi.

Kare
sumber

Jawaban:

25

Di mana perbedaan dibuat antara fungsi probabilitas dan kepadatan *, PMF hanya berlaku untuk variabel acak diskrit, sedangkan pdf berlaku untuk variabel acak kontinu.

* pendekatan formal dapat mencakup keduanya dan menggunakan istilah tunggal untuk mereka

Cdf berlaku untuk variabel acak apa pun, termasuk yang tidak memiliki pdf atau pmf.

enter image description here

( Distribusi campuran bukan satu-satunya kasus distribusi yang tidak memiliki pdf atau PMF, tetapi ini adalah situasi yang cukup umum - misalnya, pertimbangkan jumlah hujan dalam sehari, atau jumlah uang yang dibayarkan dalam klaim pada polis asuransi properti, yang salah satunya dapat dimodelkan dengan distribusi berkesinambungan tanpa inflasi)

Cdf untuk variabel acak menghasilkan P ( X x )XP(Xx)

PMF untuk variabel acak diskrit , memberikan P ( X = x ) .XP(X=x)

PDF itu sendiri tidak memberikan probabilitas , tetapi probabilitas relatif; distribusi kontinu tidak memiliki probabilitas titik. Untuk mendapatkan probabilitas dari pdf, Anda perlu mengintegrasikan beberapa interval - atau mengambil perbedaan dari dua nilai cdf.

Sulit untuk menjawab pertanyaan 'apakah mereka mengandung informasi yang sama' karena itu tergantung pada apa yang Anda maksudkan. Anda dapat beralih dari pdf ke cdf (melalui integrasi), dan dari pmf ke cdf (melalui penjumlahan), dan dari cdf ke pdf (melalui diferensiasi) dan dari cdf ke pmf (melalui perbedaan), jadi jika ada PMF atau pdf, ini berisi informasi yang sama dengan cdf.

Glen_b -Reinstate Monica
sumber
1
Glen, dapatkah Anda membantu dengan memberikan beberapa referensi di mana saya dapat membaca tentang "pdf memberikan probabilitas relatif"? Ini sangat menarik dan saya tidak ingat pernah melihatnya di buku saya. Terima kasih.
Alecos Papadopoulos
@Alecos Ini hanyalah penjelasan (mungkin dengan kata-kata yang buruk) dari fakta bahwa sementara bukan probabilitas, karena f ( x )f(x) adalah probabilitas berada di ( x , x + d x ) , maka f ( x ) / g ( x ) dapat dianggap sebagai rasio probabilitas bahwa variabel dengan kerapatan f berada dalam jarak yang sangat kecil. x dengan rasio bahwa variabel dengan kerapatan g berada dalam interval yang sama. Dalam pengertian itu ia mengungkapkan 'probabilitas relatif'. f(x)dx(x,x+dx)f(x)/g(x)fxg
Glen_b -Reinstate Monica
Saya melihat. Ini tentu saja valid sebagai perkiraan rasio probabilitas, dan tentu saja hadir dalam fungsi kepadatan empiris, di mana hal-hal terpisah karena kebutuhan.
Alecos Papadopoulos
10

PMF dikaitkan dengan variabel acak diskrit, PDF dengan variabel acak kontinu. Untuk semua jenis variabel acak acak, CDF selalu ada (dan unik), didefinisikan sebagai Sekarang, tergantung pada set dukungan dari variabel acak X , kepadatan (atau fungsi massa) tidak perlu ada. (Pertimbangkan Cantor Set dan Cantor Function , himpunan didefinisikan secara rekursif dengan menghilangkan pusat 1/3 dari interval unit, lalu ulangi prosedur untuk interval (0, 1/3) dan (2/3, 1), dll. Fungsi ini didefinisikan sebagai C ( x

FX(x)=P{Xx}.
X , jika x ada dalam set Cantor, dan batas bawah terbesar dalam Set Cantor jika x bukan anggota.) Fungsi Cantor adalah fungsi distribusi yang sangat baik, jika Anda menggunakan C ( x ) = 0 jika x < 0 dan C ( x ) = 1 jika 1 < x . Tetapi cdf ini tidak memiliki kerapatan: C ( x ) kontinu di mana-mana tetapi turunannya 0 hampir di mana-mana. Tidak ada kepadatan sehubungan dengan ukuran apa pun yang bermanfaat.C(x)=xxxC(x)=0x<0C(x)=11<xC(x)

Jadi, jawaban untuk pertanyaan Anda adalah, jika kepadatan atau fungsi massa ada, maka itu adalah turunan dari CDF sehubungan dengan beberapa ukuran. Dalam pengertian itu, mereka membawa informasi yang "sama". TETAPI, PDF dan PMF tidak harus ada. CDF harus ada.

Dennis
sumber
2
Dennis, dapatkah Anda menjelaskan apa yang Anda maksud dengan frasa " Tidak ada kepadatan sehubungan dengan ukuran apa pun "? Tentu saja memiliki kepadatan (seragam!) Sehubungan dengan dirinya sendiri.
kardinal
@ cardinal: Saya akan mencoba, tetapi saya tidak tahu bahwa itu masuk akal kecuali Anda telah mempelajari beberapa analisis nyata. Jika Anda melihat beberapa buku yang lebih tua tentang statistik matematika (misalnya, Statistik Matematika Freund ), Anda akan melihat PMF yang disebut sebagai "kepadatan". Nama "kepadatan" dibenarkan oleh ukuran probabilitas pada ruang yang dapat diukur ( Ω , σ ( Ω ) , μ ) adalah dasar dari CDF (lihat komentar Joel). Kepadatannya adalah turunan Radon-Nikodym dari μ sehubungan dengan beberapa ukuran (biasanya ukuran Lesbesgue atau ukuran Menghitung). Dalam hal ini, C ( x )μ(Ω,σ(Ω),μ)μC(x)tidak memiliki turunan RN.
Dennis
3
@ cardinal (lanjutan): Ukuran probabilitas seragam pada Cantor Set, tetapi ini adalah beastie yang aneh sehingga saya bahkan tidak yakin seperti apa aljabar . Mungkin saya seharusnya mengatakan, "Tidak ada kepadatan sehubungan dengan ukuran yang bermanfaat." σ
Dennis
2

Jawaban lain menunjuk pada fakta bahwa CDF adalah fundamental dan harus ada, sedangkan PDF dan PMF tidak dan tidak selalu ada.

S1

Tampaknya bagi saya bahwa jawabannya adalah bahwa fungsi fundamental adalah ukuran probabilitas , yang memetakan setiap subset dari ruang sampel ke probabilitas. Kemudian, ketika mereka ada, CDF, PDF dan PMF muncul dari ukuran probabilitas.

Joel Bosveld
sumber
1
Cara saya melihatnya, sebagian besar buku teks mendefinisikan "variabel acak" menjadi pemetaan dari ruang sampel ke bilangan real. Pada dasarnya, "variabel acak" bernilai nyata.
Neil G
1
(R,B,F)(Ω,σ(Ω),μ)Ωμ
FX(x)=μ{ω|X(ω)x}.