Saya tahu bahwa PDF adalah turunan pertama dari CDF untuk variabel acak kontinu, dan perbedaan untuk variabel acak diskrit. Namun, saya ingin tahu mengapa ini terjadi, mengapa ada dua kasus berbeda untuk diskrit dan kontinu?
Saya tahu bahwa PDF adalah turunan pertama dari CDF untuk variabel acak kontinu, dan perbedaan untuk variabel acak diskrit. Namun, saya ingin tahu mengapa ini terjadi, mengapa ada dua kasus berbeda untuk diskrit dan kontinu?
Saya akan menjadi sedikit tidak tepat, tetapi semoga intuitif.
Distribusi probabilitas yang diskrit dan berkesinambungan harus diperlakukan secara berbeda. Untuk setiap nilai dalam distribusi diskrit ada kemungkinan terbatas. Dengan koin yang adil, probabilitas kepala adalah 0,5, dengan dadu enam sisi yang adil, probabilitas 1 adalah satu keenam, dll. Namun, probabilitas nilai tertentu dalam distribusi kontinu adalah nol, karena satu nilai spesifik adalah hanya satu nilai dari jumlah tak terhingga dari nilai yang mungkin, dan jika nilai spesifik memiliki probabilitas> 0, maka mereka tidak akan meringkas hingga 1. Oleh karena itu, dengan distribusi kontinu kita berbicara tentang probabilitas rentang nilai.
"Jumlah hingga" adalah kunci dalam menjawab pertanyaan Anda. Jika Anda sama sekali tidak asing dengan kalkulus dan sejarahnya, Anda memahami bahwa tanda integral — yang memanjang 'S':—Adalah jenis penjumlahan khusus: yang menggambarkan kasus pembatas saat kita mendekati penjumlahan nilai tak terhingga dari nilai-nilai kecil yang semakin menghilang di antara titik-titik dan pada beberapa fungsi. Jika fungsi itu adalah PDF, kita dapat mengintegrasikannya (meringkas) untuk menghasilkan CDF, dan sebaliknya membedakan (perbedaan) CDF untuk mendapatkan PDF.
Dalam kasus diskrit, kita cukup melakukan penjumlahan aritmatika standar (karenanya, besar '', daripada notasi' S 'tinggi) dan aritmatika berbeda.
"If that function is a CDF, we can integrate it (sum up) to produce a PDF"
Anda salah memesan, ini membingungkan. Saya diedit untuk memperbaiki.Perbedaannya adalah untuk kenyamanan dan pemahaman orang-orang yang tidak harus menanggung Ph.D. kursus teori tingkat di mana Anda memperoleh dan membuktikan "Integral sehubungan dengan Menghitung Mengukur" . Yang menunjukkan tidak ada perbedaan antara distribusi diskrit dan kontinu, bahwa jumlah adalah benar-benar integral (dan seperti yang telah disebutkan @Alexis, integral pada dasarnya adalah jumlah) dan perbedaan sebenarnya adalah turunan (sedikit lebih mudah untuk melihat bahwa turunan adalah perbedaan yang diskalakan dengan tepat).
Buku pelajaran dan kursus akan memperlakukan mereka berbeda karena lebih mudah untuk mengajar / memahami sejak awal daripada membutuhkan matematika yang menunjukkan tidak ada perbedaan.
sumber
(Setidaknya pada tingkat pengantar) istilah kepadatan hanya merujuk ke variabel acak kontinu.
Variabel acak diskrit memiliki fungsi massa probabilitas , kadang-kadang disebut fungsi probabilitas (pmf atau pf, bukan pdf). Ini tidak mengembalikan kepadatan tetapi probabilitas aktual.
Beberapa variabel acak tidak memiliki keduanya (tetapi mereka masih memiliki cdf).
Pikirkan tentang apa definisi dari cdf (FX( x ) = P( X≤ x ) ), dan kemudian apa yang terjadi sebagai x bergerak sedikit dalam kedua kasus.
Sekarang pertimbangkan bahwa setiap lompatan dalam cdf menyiratkan bahwa nilai tertentu memiliki probabilitas non-nol (ituP( X≤ x ) > P( X< x ) dan perbedaannya adalah P( X= x ) ). Itu probabilitas tidak nol untuk khususnyax -nilai adalah apa yang dicatat oleh PMF halX( x ) = P( X=x ) .
(Dalam perawatan yang lebih lanjut, perbedaannya menghilang.)
sumber
Sebenarnya, Anda dapat memperlakukan distribusi kontinu dan diskrit dengan cara yang sama, tetapi untuk melakukan ini Anda telah memperkenalkan fungsi delta Dirac, batas kiri dan konsep "lanjutan" lainnya.
Jadi, cara mudah untuk menjawab pertanyaan Anda adalah bahwa CDF melompat secara spontan. Anda tidak dapat membedakannya di mana-mana karena itu.
Sekali lagi, jika Anda tahu fungsi delta , semuanya mungkin!
sumber