Apakah ada 99 persen, atau 100 persen? Dan apakah mereka kelompok angka, atau garis pembagi, atau petunjuk ke nomor individu?
Saya kira pertanyaan yang sama akan berlaku untuk kuartil atau kuantil apa pun.
Saya telah membaca bahwa indeks angka pada persentil tertentu (p), diberikan n item, adalah i = (p / 100) * n
Itu menunjukkan kepada saya bahwa ada 100 persen .. karena seandainya Anda memiliki 100 angka (i = 1 hingga i = 100), maka masing-masing akan memiliki indeks (1 hingga 100).
Jika Anda memiliki 200 angka, akan ada 100 persen, tetapi masing-masing akan merujuk pada sekelompok dua angka. Atau 100 pembagi tidak termasuk pembagi paling kiri atau paling kanan karena jika tidak Anda akan mendapatkan 101 pembagi. Atau penunjuk ke nomor individual sehingga persentil pertama akan merujuk ke angka kedua, (1/100) * 200 = 2 Dan persentil ke seratus akan merujuk ke angka ke-200 (100/100) * 200 = 200
Saya kadang-kadang mendengar ada 99 persentil ..
Google menunjukkan kamus oxford yang mengatakan tentang persentil- "masing-masing dari 100 kelompok yang sama di mana suatu populasi dapat dibagi sesuai dengan distribusi nilai-nilai variabel tertentu." dan "masing-masing dari 99 nilai antara dari variabel acak yang membagi distribusi frekuensi menjadi 100 kelompok tersebut."
Wikipedia mengatakan "persentil ke-20 adalah nilai di bawahnya yang dapat ditemukan 20% dari pengamatan" Tetapi apakah ini benar-benar berarti "nilai di bawah atau sama dengan yang, 20% dari pengamatan dapat ditemukan" yaitu "nilai untuk mana 20 % dari nilai adalah <= untuk itu ". Jika hanya <dan bukan <=, maka dengan alasan itu, persentil ke-100 akan menjadi nilai di bawah mana 100% dari nilai dapat ditemukan. Saya telah mendengarnya sebagai argumen bahwa tidak boleh ada persentil ke-100, karena Anda tidak dapat memiliki angka di mana ada 100% angka di bawahnya. Tapi saya pikir mungkin argumen bahwa Anda tidak dapat memiliki persentil ke-100 tidak benar dan didasarkan pada kesalahan bahwa definisi persentil melibatkan <= tidak <. (atau> = tidak>). Jadi persentil ke seratus akan menjadi angka terakhir dan akan menjadi>
Jawaban:
Kedua indera persentil , kuartil , dan sebagainya ini digunakan secara luas. Paling mudah untuk menggambarkan perbedaan dengan kuartil:
pengertian "pembagi" - ada 3 kuartil, yang merupakan nilai yang membagi distribusi (atau sampel) menjadi 4 bagian yang sama:
(Kadang-kadang ini digunakan dengan nilai-nilai maks dan min disertakan, jadi ada 5 kuartil bernomor 0–4; perhatikan ini tidak bertentangan dengan penomoran di atas, itu hanya memperpanjangnya.)
pengertian "bin": ada 4 kuartil, himpunan bagian di mana 3 nilai tersebut membagi distribusi (atau sampel)
Tidak ada penggunaan yang dapat secara wajar disebut "salah": keduanya digunakan oleh banyak praktisi berpengalaman, dan keduanya muncul dalam banyak sumber otoritatif (buku teks, kamus teknis, dan sejenisnya).
Dengan kuartil, pengertian yang digunakan biasanya jelas dari konteks: berbicara tentang nilai dalam kuartil ketiga hanya bisa menjadi pengertian "bin", sementara berbicara tentang semua nilai di bawah kuartil ketiga kemungkinan besar berarti arti "pembagi". Dengan persentil, perbedaannya lebih sering tidak jelas, tetapi juga tidak begitu signifikan untuk sebagian besar tujuan, karena 1% dari distribusi sangat kecil - strip sempit kira-kira satu garis. Berbicara tentang semua orang di atas persentil ke-80 dapat berarti 20% teratas atau 19% teratas, tetapi dalam konteks informal itu bukan perbedaan besar, dan dalam pekerjaan yang keras, makna yang diperlukan mungkin harus diklarifikasi oleh sisa konteks.
(Bagian dari jawaban ini diadaptasi dari /math/1419609/are-there-3-or-4-quartiles-99-or-100-percentiles , yang juga memberikan kutipan + referensi.)
sumber
Ambil jawaban ini dengan sebutir garam - ini dimulai dengan salah dan saya masih memutuskan apa yang harus dilakukan dengan itu.
Pertanyaannya adalah sebagian tentang bahasa dan penggunaan, sedangkan jawaban ini berfokus pada matematika. Saya berharap bahwa matematika akan menyediakan kerangka kerja untuk memahami berbagai penggunaan.
Contoh 1): Saya akan meninggalkan ini untuk yang terakhir; terus membaca.
Contoh lain dari 2): Untuk distribusi yang seragam pada dua interval disjoint dari 0 ke 1 dan 2 ke 3, CDF terlihat seperti ini.
Sebagian besar kuantil dari distribusi ini ada dan unik, tetapi median (persentil ke-50) secara inheren ambigu. Dalam R, mereka setengah jalan:
quantile(c(runif(100), runif(100) + 2), 0.5)
mengembalikan sekitar 1,5.Untuk persentil ke-60, R mengembalikan 1 (
quantile(c(rpois(lambda = 1, n = 1000) ), 0.60)
). Untuk persentil ke-65, R juga mengembalikan 1. Anda dapat menganggap ini sebagai menggambar 100 pengamatan, memeringkatnya rendah ke tinggi, dan mengembalikan item ke-60 atau ke-65. Jika Anda melakukan ini, Anda akan paling sering mendapatkan 1.Ketika datang ke data nyata, semua distribusi diskrit. (CDF empiris
runif(100)
ataunp.random.random(100)
memiliki 100 kenaikan mengelompok sekitar 0,5.) Tetapi, alih-alih memperlakukannya sebagai diskrit,quantile
fungsi R tampaknya memperlakukannya sebagai sampel dari distribusi kontinu. Sebagai contoh, median (persentil ke-50 atau 0,5 kuantil) dari sampel 3,4, 5, 6, 7, 8 diberikan sebagai 5,5. Jika Anda mengambil 2n sampel dari distribusi unif (3,8) dan mengambil angka apa pun antara sampel ke-n dan (n + 1), Anda akan berkumpul pada 5,5 seiring n bertambah.Sangat menarik untuk juga mempertimbangkan distribusi seragam diskrit dengan probabilitas yang sama mengenai 3,4,5,6,7,8. (Die roll ditambah dua.) Jika Anda mengambil pendekatan sampel-dan-peringkat yang diuraikan di atas untuk distribusi Poisson, Anda biasanya akan mendapatkan 5 atau 6. Ketika sampel bertambah besar, distribusi untuk angka setengah naik akan berkumpul pada setengah balita dan setengah enam. 5.5 juga tampak seperti kompromi yang masuk akal.
sumber
R
, misalnya, ketikquantile(0)
.Saya diajari bahwa pengamatan dalam persentil ke-n lebih besar dari n% pengamatan dalam dataset yang dipertimbangkan. Yang bagi saya menyiratkan bahwa tidak ada persentil 0 atau 100. Tidak ada pengamatan yang bisa lebih besar dari 100% pengamatan karena merupakan bagian dari 100% itu (dan logika yang sama berlaku dalam kasus 0).
Sunting: Untuk apa nilainya, ini juga konsisten dengan penggunaan non-akademis dari istilah yang saya temui: "X ada dalam persentil ke-n " menunjukkan bahwa persentil adalah grup, bukan batas.
Sayangnya saya tidak punya sumber untuk ini yang saya bisa tunjukkan.
sumber
Ada cara lain untuk menghitung persentil, yang berikut, bukan satu-satunya. Diambil dari Sumber ini .
Contoh dari catatan yang sama untuk ilustrasi:
Tidak.
yang menghasilkan
sumber
Catatan- Saya akan menerima jawaban orang lain dan bukan jawaban saya. Tetapi saya memang melihat beberapa komentar yang berguna jadi saya hanya menulis jawaban yang menyebutkannya.
Berdasarkan jawaban Nick "-iles" terminologi untuk setengah persen atas
tampaknya istilah-istilahnya ambigu, dan saya kira (berdasarkan pemahaman saya tentang pos itu), terminologi yang lebih baik adalah titik X%, dan kelompok X% -Y%; begitu titik kuantil (jadi untuk titik kuartil yang bisa berupa apa saja dari 0 hingga 4); kelompok kuantil mulai dari titik kuantil X ke titik kuantil Y.
Either way seseorang akan mendapatkan 101 untuk persentil, meskipun satu komentar menunjukkan bahwa seseorang dapat merujuk ke 101 poin (saya kira jika Anda menghitung poin persentil, dan hanya bilangan bulat), tetapi bahkan kemudian, jika seseorang berbicara tentang 1, 2, 3, persentil atau kuantil, ia menghitung dan seseorang tidak dapat menghitung yang pertama sebagai 0, dan Anda tidak dapat memiliki mis. lebih dari 4 kuartil atau lebih dari 100 persen. Jadi jika berbicara 1, 2, 3, terminologi itu tidak dapat benar-benar merujuk ke poin 0. Jika seseorang mengatakan poin 0, maka sementara itu jelas maksud mereka adalah titik 0, saya pikir mereka harus benar-benar mengatakan titik kuantil 0. Atau kelompok Quantile pada titik 0. Bahkan ilmuwan komputer tidak akan mengatakan 0; bahkan mereka menghitung item pertama sebagai 1, dan jika mereka menyebutnya item 0, itu adalah pengindeksan dari 0, bukan hitungan.
Sebuah komentar menyebutkan "Tidak mungkin ada 100. Baik 99 atau 101, tergantung pada apakah Anda menghitung maksimum dan minimum". Saya pikir ada kasus untuk 99 atau 101, ketika berbicara tentang poin kuantil daripada kelompok, meskipun saya tidak akan mengatakan 0. Untuk n item, suatu indeks dapat berubah dari 0 ... n-1 dan seseorang tidak akan menulis th / st misalnya 1, 2 dll, pada indeks (kecuali jika mungkin indeks mengindeks item pertama sebagai 1). Tetapi indeks yang memulai item pertama dengan indeks 0 bukanlah hitungan ke-1, ke-3 ke-3. mis. item dengan indeks 0 adalah item pertama, orang tidak akan mengatakan 0 dan memberi label item kedua pertama.
sumber