Saya punya vektor
x <- c(1,2,3,4,5,5,5,6,6,6,6,
7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,
7,7,7,7,7,7,7,7,8,8,8,8,9,9,9,10)
(Vektor aktual saya memiliki panjang> 10.000) dan saya ingin mencari interval di mana 90% dari kepadatan terletak. Apakah quantile(x, probs=c(0.05,0.95), type=5)
yang paling tepat atau ada cara lain?
Jawaban:
Seperti yang ditunjukkan di atas, ada banyak cara berbeda untuk mendefinisikan interval yang mencakup 90% dari kepadatan. Salah satu yang belum ditunjukkan adalah interval kepadatan [posterior] tertinggi ( wikipedia ), yang didefinisikan sebagai "interval terpendek yang perbedaan nilai fungsi kepadatan kumulatif empiris dari titik akhir adalah probabilitas nominal".
sumber
Ini sepertinya pendekatan yang paling mudah. Fungsinya cukup cepat. Saya menggunakannya sepanjang waktu pada sampel yang ratusan kali lebih besar dari yang Anda gunakan, dan stabilitas perkiraan harus baik pada ukuran sampel Anda.
Ada fungsi dalam paket lain yang menyediakan set statistik deskriptif yang lebih lengkap. Yang saya gunakan adalah
Hmisc::describe
, tetapi ada beberapa paket lain dengandescribe
fungsi.sumber
Cara Anda tampaknya masuk akal, terutama dengan data diskrit dalam contoh,
tetapi cara lain adalah dengan menggunakan kernel densitas yang dihitung:
sumber
Iya. :-). Anda mungkin menemukan hasil dari
stats::density
menjadi lebih bermanfaat.sumber