Ini sebagian masalah selera dan konvensi, tetapi teori, perhatian pada tujuan Anda, dan sejumlah kecil ilmu saraf kognitif [lihat referensi] dapat memberikan beberapa panduan.
Karena pdf dan cdf menyampaikan informasi yang sama, perbedaan di antara mereka muncul dari cara mereka melakukannya: pdf mewakili probabilitas dengan area sedangkan cdf mewakili probabilitas dengan jarak (vertikal) . Studi menunjukkan bahwa orang membandingkan jarak lebih cepat dan lebih akurat daripada membandingkan daerah dan bahwa mereka secara sistematis salah memperkirakan daerah. Dengan demikian, jika tujuan Anda adalah untuk menyediakan alat grafis untuk membaca probabilitas, Anda sebaiknya menggunakan cdf.
Pdf dan cdf juga mewakili kerapatan probabilitas : yang pertama melakukannya dengan ketinggian sedangkan yang kedua mewakili kerapatan berdasarkan kemiringan . Sekarang tabel diputar, karena orang adalah penaksir kemiringan yang buruk (yang merupakan garis singgung dari sudut; kita cenderung melihat sudut itu sendiri). Kepadatan bagus dalam menyampaikan informasi tentang mode, bobot ekor, dan kesenjangan. Mendukung menggunakan pdf dalam situasi seperti itu dan di mana pun di mana rincian lokal dari distribusi probabilitas perlu ditekankan.
Terkadang pdf atau cdf memberikan informasi teoretis yang bermanfaat. Nilainya (atau lebih tepatnya kebalikannya) terlibat dalam rumus untuk kesalahan standar untuk kuantil, ekstrem, dan statistik peringkat. Tampilkan pdf daripada cdf dalam situasi seperti itu. Ketika mempelajari korelasi multivariat dalam pengaturan nonparametrik, seperti dengan copulas , cdf ternyata lebih berguna (mungkin karena itu adalah fungsi yang mengubah hukum probabilitas kontinu menjadi seragam).
Pdf atau cdf dapat dikaitkan dengan erat dengan uji statistik tertentu. Tes Kolmogorov-Smirnov (dan statistik KS) memiliki representasi grafis sederhana dalam hal buffer vertikal di sekitar cdf; tidak memiliki representasi grafis sederhana dalam hal pdf (yang saya tahu).
Ccdf (cdf komplementer) digunakan dalam aplikasi khusus yang berfokus pada penyintas dan kejadian langka. Penggunaannya cenderung ditetapkan oleh konvensi.
Referensi
WS Cleveland (1994). Elemen Data Grafik. Summit, NJ, AS: Hobart Press. ISBN 0-9634884-1-4
BD Dent (1999). Kartografi: Desain Peta Tematik Edisi ke-5. Boston, MA, AS: WCB McGraw-Hill.
AM MacEachren (2004). Bagaimana Peta Bekerja. New York, NY, AS: The Guilford Press. ISBN 1-57230-040-X
Saya setuju dengan jawaban whuber, tetapi ada satu poin kecil tambahan:
CDF memiliki penduga non-parametrik sederhana yang tidak memerlukan pilihan lain: fungsi distribusi empiris . Ini tidak cukup begitu sederhana untuk memperkirakan PDF. Jika Anda menggunakan histogram, Anda harus memilih lebar nampan dan titik awal untuk nampan pertama. Jika Anda menggunakan estimasi kepadatan kernel, Anda harus memilih bentuk dan bandwidth kernel. Pembaca yang mencurigakan atau sinis mungkin bertanya-tanya apakah Anda benar-benar memilih ini sepenuhnya apriori atau jika Anda mencoba beberapa nilai yang berbeda dan memilih yang memberikan hasil yang paling Anda sukai.
Ini hanya titik kecil saja. Yang dibuat whuber lebih penting, jadi saya mungkin hanya menggunakan ini untuk memilih ketika saya masih ragu-ragu setelah mempertimbangkan itu.
sumber
Saya kira itu tergantung pada statistik atau temuan apa yang akan Anda temukan, riset, pelajari, atau laporkan. Saya berasumsi Anda kemungkinan akan menggunakan grafik ini untuk mewakili temuan untuk topik universitas Anda, bukan?
Seperti misalnya, jika Anda ingin mempresentasikan temuan Anda tentang mengatakan, 'Berapa lama pengguna tinggal di situs web tertentu', mungkin baik untuk menunjukkannya dalam CDF karena menunjukkan akumulasi waktu yang dihabiskannya di situs web itu, melalui halaman, dll. .
Di sisi lain, jika Anda hanya ingin menunjukkan kemungkinan pengguna mengklik tautan iklan (mis. Google adwords link) maka Anda mungkin ingin mempresentasikannya dalam bentuk PDF karena mungkin akan menjadi kurva lonceng distribusi normal dan Anda dapat menunjukkan probabilitas yang terjadi.
Semoga ini bisa membantu, Jeff
sumber