Mengapa Fungsi Distribusi Kumulatif (CDF) secara unik menentukan distribusi?

17

Saya selalu diberi tahu CDF itu unik namun PDF / PMF tidak unik, mengapa begitu? Bisakah Anda memberi contoh di mana PDF / PMF tidak unik?

DKangeyan
sumber
6
[0,1](0,1)Pr(j2i)=212ii 1 j0<j2i<1i1j
2
Tidak semua distribusi bahkan memiliki PDF, atau memiliki PMF, sambil melihat CDF memberikan pandangan yang menyatukan hal-hal. Variabel kontinu memiliki CDF yang terlihat halus, variabel diskrit memiliki "tangga", dan beberapa CDF bercampur.
Silverfish
6
@ Silververfish: ... dan beberapa di antaranya tidak ada di atas! :-)
kardinal
3
Untuk mengatasi judul (mungkin agak longgar), CDF mendefinisikan distribusi karena CDF (atau hanya setara dengan DF / 'fungsi distribusi'; "C" hanya bertindak untuk mengklarifikasi bahwa objek yang sedang kita bicarakan) adalah apa istilahnya 'distribusi' secara harfiah mengacu pada; "D" adalah petunjuk pada bagian itu. Itu unik berikut dari "F" - fungsi bernilai tunggal, jadi jika dua fungsi distribusi identik objek yang mereka tetapkan adalah sama; jika DF berbeda di mana pun mereka definisi akan berbeda pada titik-titik tersebut. Apakah itu tautologi? Aku rasa ini.
Glen_b -Reinstate Monica
4
@ Glen_b Ini tautologis hanya untuk intuisi yang terlatih. Fungsi distribusi F hanya memberikan probabilitas bentuk F(x)=Pr{ωΩ|X(ω)x} sedangkan seluruh distribusi menentukan probabilitas bentuk Pr({ωΩ|X(ω)B} untuk set terukur sewenang-wenang BR Anda harus menunjukkan F menentukan distribusi Seperti yang ditunjukkan oleh NicholasB, itu adalah masalah memperluas pra-ukur dari setengah-cincin (interval setengah-terbuka), μ((a,b])=F(b)F(a) , ke bidang sigma Lebesgue penuh dan menunjukkan itu unik
Whuber

Jawaban:

13

Mari kita mengingat beberapa hal. Mari menjadi ruang probabilitas , adalah set sampel kami, adalah kami -algebra, dan adalah fungsi probabilitas didefinisikan pada . Sebuah variabel acak adalah fungsi terukur yaitu untuk setiap Lebesgue terukur bagian di . Jika Anda tidak terbiasa dengan konsep ini maka semua yang saya katakan sesudahnya tidak akan masuk akal.(Ω,A,P)A σ P AΩAσPAX - 1 ( S ) A RX:ΩRX1(S)AR

Kapan saja kita memiliki variabel acak, , itu menginduksi ukuran probabilitas pada \ mathbb {R} oleh pushforward kategoris. Dengan kata lain, X '(S) = P (X ^ {- 1} (S)) . Sepele untuk memeriksa bahwa X ' adalah ukuran probabilitas pada \ mathbb {R} . Kami menyebutnya X' yang distribusi dari X .X R X ( S ) = P ( X - 1 ( S ) ) X R X X:ΩRXRX(S)=P(X1(S))XRXX

Sekarang terkait dengan konsep ini adalah sesuatu yang disebut fungsi distribusi dari variabel fungsi. Diberikan variabel acak X:ΩR kita mendefinisikan F(x)=P(Xx) . Fungsi distribusi F:R[0,1] memiliki properti berikut:

  1. F adalah kontinu kanan .

  2. F tidak menurun

  3. F()=1 dan F()=0 .

Jelas variabel acak yang sama memiliki fungsi distribusi dan distribusi yang sama.

Untuk membalikkan proses dan mendapatkan ukuran dengan fungsi distribusi yang diberikan cukup teknis. Katakanlah Anda diberi fungsi distribusi . Tentukan . Anda harus menunjukkan bahwa adalah ukuran pada semi-aljabar interval dari . Setelah itu Anda dapat menerapkan Carathéodory teorema ekstensi untuk memperluas ke ukuran probabilitas pada .F(x)μ(a,b]=F(b)F(a)μ(a,b]μR

Nicolas Bourbaki
sumber
4
Ini adalah awal yang baik untuk sebuah jawaban, tetapi mungkin secara tidak sengaja mengaburkan masalah yang ada. Masalah utama tampaknya menunjukkan bahwa dua ukuran dengan fungsi distribusi yang sama, pada kenyataannya, sama. Ini tidak membutuhkan apa pun selain teorema - Dynkin dan fakta bahwa kumpulan bentuk membentuk sistem yang menghasilkan aljabar-Borigma . Kemudian ketidaksamaan kepadatan (dengan asumsi itu ada!) dapat diatasi dan dikontraskan dengan yang di atas.πλ(,b]πσ
kardinal
3
(Satu tambahan minor berdalih: Variabel acak biasanya didefinisikan dalam hal set Borel daripada set Lebesgue.) Saya pikir dengan beberapa editan kecil jawaban ini akan menjadi sangat jelas. :-)
kardinal
@ kardinal Saya pikir analisis dulu, probabilitas kedua. Oleh karena itu, ini dapat menjelaskan mengapa saya lebih suka memikirkan set Lebesgue. Dalam kedua kasus itu tidak mempengaruhi apa yang dikatakan.
Nicolas Bourbaki
4

Untuk menjawab permintaan contoh dua densitas dengan integral yang sama (yaitu memiliki fungsi distribusi yang sama) pertimbangkan fungsi-fungsi ini didefinisikan pada bilangan real:

 f(x) = 1 ; when x is odd integer
 f(x) = exp(-x^2)  ; elsewhere

lalu;

 f2(x) = 1  ; when x is even integer
 f2(x) = exp(-x^2) ;  elsewhere

Mereka sama sekali tidak sama dengan x, tetapi keduanya adalah kepadatan untuk distribusi yang sama, karenanya kepadatan tidak secara unik ditentukan oleh distribusi (kumulatif). Ketika kepadatan dengan domain nyata hanya berbeda pada set nilai x yang dapat dihitung, maka integral akan sama. Analisis matematika tidak benar-benar untuk pingsan hati atau pikiran konkret.

DWIN
sumber
0

Saya tidak setuju dengan pernyataan, "fungsi distribusi probabilitas tidak secara unik menentukan ukuran probabilitas", yang Anda katakan dalam pertanyaan pembuka. Itu menentukan secara unik.

Misalkan menjadi dua fungsi massa probabilitas. Jika, E f 1 = E f 2 Untuk setiap himpunan terukur E maka f 1 = f 2 hampir di mana-mana. Ini secara unik menentukan pdf (karena dalam analisis kami tidak peduli jika mereka tidak setuju pada serangkaian ukuran nol).f1,f2:R[0,)

Ef1=Ef2
Ef1=f2

Kita dapat menulis ulang integral di atas ke dalam, Di mana g = f 1 - f 2 adalah fungsi yang dapat diintegrasikan.

Eg=0
g=f1f2

Tentukan , sehingga E g = 0 . Kami menggunakan teorema terkenal bahwa jika integral dari fungsi non-negatif adalah nol maka fungsi tersebut hampir nol di mana-mana. Secara khusus, g = 0 ae di E . Jadi f 1 = f 2 ae di E . Sekarang ulangi argumen ke arah lain dengan F = { x R | g 0 }E={xR | g0}Eg=0g=0Ef1=f2EF={xR | g0}. Kita akan mendapatkan bahwa ae di F . Dengan demikian, f 1 = f 2 ae di E F = R .f1=f2Ff1=f2EF=R

Nicolas Bourbaki
sumber