Bagaimana saya harus menginterpretasikan ketinggian plot kepadatan:
Misalnya dalam plot di atas, puncaknya sekitar 0,07 pada x = 18. Dapatkah saya menyimpulkan bahwa sekitar 7% dari nilai sekitar 18? Bisakah saya lebih spesifik dari itu? Ada juga puncak kedua di x = 30 dengan tinggi 0,02. Apakah itu berarti bahwa sekitar 2% dari nilai sekitar 30?
Sunting: Pertanyaan pada Dapatkah nilai distribusi probabilitas melebihi 1 menjadi OK?membahas nilai probabilitas> 1 yang tidak menjadi masalah sama sekali di sini. Ini juga membahas bahwa dalam kaitannya dengan classfier naif Bayes yang juga bukan intinya di sini. Saya ingin memiliki, dalam bahasa yang sederhana, kesimpulan numerik yang dapat kita tarik dari kurva kepadatan seperti itu. Peran area di bawah kurva dibahas tetapi pertanyaan saya secara khusus inferensi apa yang dapat kita tarik tentang kombinasi x dan y tertentu yang ada pada kurva. Sebagai contoh, bagaimana kita menghubungkan x = 30 dan y = 0,02 pada grafik ini. Pernyataan apa yang bisa kita tulis mengenai hubungan antara 30 dan 0,02 di sini. Karena kepadatan adalah untuk satu nilai satuan, dapatkah kita mengatakan bahwa 2% dari nilai terjadi antara 29,5 dan 30,5? Jika itu masalahnya, bagaimana kami menafsirkan jika nilai bervariasi dari hanya 0 hingga 1, seperti dalam plot berikut:
Jika 100% nilai terjadi antara 0 dan 1, mengapa ada kurva di luar 0 dan 1?
Ada bagian datar di sini di x = 0,1 ke x = 0,2 di mana y sama dengan 0,8. Membentuk persegi panjang. Bagaimana kita bisa mengetahui proporsi nilai apa yang terjadi antara x = 0,1 dan x = 0,2
(PS: Jika Anda menemukan pertanyaan ini menarik / penting, harap perbaiki;)
sumber
Jawaban:
Anda harus berhati-hati dengan kata-kata Anda di sini. Dengan asumsi x adalah variabel kontinu, probabilitas setiap nilai individu adalah nol. Berbicara, seperti yang Anda lakukan, tentang kemungkinan suatu nilai yang berada di beberapa titik tidak masalah, meskipun Anda mungkin ingin sedikit lebih tepat. Pernyataan kedua Anda, di mana Anda memberikan interval bersama dengan probabilitas adalah sesuatu yang saya akan cari.
Intinya, integral fungsi densitas berkenaan dengan x akan memberi tahu Anda tentang probabilitas itu sendiri (itu sebabnya itu disebut kepadatan ). Jelas, interval yang akan Anda integrasikan mungkin kecil secara sewenang-wenang, sehingga Anda bisa mendekati titik ke tingkat yang sewenang-wenang. Yang mengatakan, ketika fungsi kerapatan bervariasi sangat lambat selama interval itu, Anda dapat memperkirakan integral dengan beberapa teknik numerik, seperti aturan trapesium .
Untuk meringkas: ketinggian fungsi kepadatan hanya itu, tingginya. Apa pun yang Anda ingin simpulkan tentang probabilitas harus menyertakan pengintegrasian beberapa bentuk atau lainnya.
sumber