Saya tertarik dengan definisi kuartil yang biasanya digunakan saat Anda menggunakan statistik dasar. Saya memiliki buku tipe Stat 101 dan hanya memberikan definisi intuitif. "Sekitar seperempat dari data jatuh pada atau di bawah kuartil pertama ..." Tapi, itu memberikan contoh di mana ia menghitung Q1, Q2, dan Q3 untuk set data
5, 7, 9, 10, 11, 13, 14, 15, 16, 17, 18, 18, 20, 21, 37
Karena ada 15 lembar data, ia memilih 15 sebagai median, Q2. Ini kemudian membagi data yang tersisa menjadi dua bagian, 5 hingga 14, dan 16 hingga 37. Masing-masing berisi 7 bagian data dan mereka menemukan median masing-masing set, 10 dan 18, masing-masing sebagai Q1 dan Q3. Beginilah cara saya menghitungnya sendiri.
Saya melihat artikel Wikipedia dan memberikan 2 metode. Satu setuju dengan yang di atas, dan satu mengatakan Anda juga bisa memasukkan median 15 di kedua set (tetapi Anda tidak akan menyertakan median jika itu adalah rata-rata dari dua angka tengah dalam kasus jumlah poin data yang genap). Ini semua masuk akal bagi saya.
Tapi, kemudian saya memeriksa Excel untuk melihat bagaimana Excel menghitungnya. Saya menggunakan Excel 2010, yang memiliki 3 fungsi berbeda. Kuartil tersedia di 2007 dan versi sebelumnya. Sepertinya mereka ingin Anda berhenti menggunakan ini pada 2010 tetapi masih tersedia. Quartile.Inc baru tetapi setuju dengan Quartile sejauh yang saya tahu. Dan, ada Kuartil. Juga. Kedua 2 terakhir adalah baru di 2010 saya percaya. Kali ini, saya hanya mencoba menggunakan bilangan bulat 1, 2, 3, ..., 10. Saya berharap Excel memberi median 5,5, Q1 dari 3, dan Q3 dari 8. Metode dari buku statistik, juga karena kedua metode di Wikipedia akan memberikan jawaban ini, karena median adalah rata-rata dari dua angka tengah. Excel memberi
quartile number, Quartile.Inc, Quartile.Exc
1, 3.25, 2.75
2, 5.5, 5.5
3, 7.75, 8.25
Tak satu pun dari ini setuju dengan apa yang saya bicarakan sebelumnya.
Deskripsi dalam file bantuan untuk Excel adalah:
Quartile.Inc - Mengembalikan kuartil dari kumpulan data, berdasarkan nilai persentil dari 0..1, inklusif.
Quartile.Exc - Mengembalikan kuartil kumpulan data, berdasarkan nilai persentil dari 0..1, eksklusif.
Adakah yang bisa membantu saya memahami definisi yang digunakan Excel ini?
Jawaban:
Biasanya, peringkat (antara dan untuk data) dikonversi ke persen melalui rumusr 1 n n p
untuk beberapa "posisi posisi" yang telah ditentukan sebelumnya antara dan , inklusif. Memecahkan untuk dalam hal memberiα 0 1 r p
Excel secara historis menggunakan untuk fungsi dan fungsinyaα=1
PERCENTILE
QUARTILE
. The dokumentasi online untukQUARTILE.INC
danQUARTILE.EXC
tidak berguna, jadi kita harus membalik-insinyur apa fungsi ini lakukan.Misalnya, dengan data , kami memiliki dan untuk tiga kuartil. Menggunakan dalam rumus sebelumnya menghasilkan peringkat , , dan , mereproduksi hasil untuk .(1,2,3,4,5,6,7,8,9,10) n=10 p∈{25,50,75} α=1 9(0.25)+1=3.25 9(0.50)+1=5.5 9(0.75)+1=7.75
QUARTILE.INC
Jika sebaliknya kita menetapkan peringkat yang sesuai adalah , , dan , mereproduksi hasil untuk .11 ( 0.25 ) = 2.75 11 ( 0.50 ) = 5.5 11 ( 0.75 ) = 8.25α=0 11(0.25)=2.75 11(0.50)=5.5 11(0.75)=8.25
QUARTILE.EXC
Pengujian lebih lanjut pada bagian Anda (saya tidak memiliki versi Excel terbaru) dapat menetapkan validitas tebakan saya bahwa kedua versi fungsi kuartil ini ditentukan oleh dua nilai ( ) ekstrem ini dariα .
By the way, peringkat fraksional dikonversi menjadi nilai data dengan cara interpolasi linier. Prosesnya dijelaskan dan diilustrasikan dalam catatan mata kuliah saya di Percentiles dan EDF Plots - lihat di dekat bagian bawah halaman itu. Ada juga tautan ke lembar kerja Excel yang menggambarkan perhitungan.
Jika Anda ingin menerapkan fungsi persentil umum di Excel , inilah makro VBA untuk melakukannya:
Ini mengubah persentase nominal (seperti 25/100) menjadi persen yang akan menyebabkan
PERCENTILE
fungsi Excel mengembalikan nilai yang diinginkan. Ini dimaksudkan untuk digunakan dalam formula sel, seperti pada=PERCENTILE(Data, PercentileA(0.25, Count(Data), 0.5))
.sumber
Tampaknya bagi saya bahwa Excel
quartile.inc
setuju dengan yang asliquartile
, yang setuju dengan standar R dan definisi lainnya.Dengan petunjuk bermanfaat dari whuber, saya menemukan bahwa Excel
quartile.exc
tampaknya setuju (pada kasus 1..10) dengantype=6
definisi R tentang kuantil:Yang tampaknya membuat jawaban untuk pertanyaan Anda: "Ya, Minitab dan SPSS lakukan."
sumber
Saya pikir rasa exc quartile hanya mengabaikan 5 dan 37 (min dan maks dalam data asli Anda).
Di Stata, baik versi default dan alternatif memberi Anda nilai quartile.exc dengan data ini.
sumber
QUARTILE.EXC
.#NUM!
PERCENTILE
Banyak hal detail yang menarik tetapi untuk kembali ke pertanyaan awal, saya tidak melihat bahwa dua cara yang sedikit berbeda yang mungkin tidak memberikan jawaban yang persis sama benar-benar penting. Kuatil pertama adalah titik di mana 25% dari pengamatan jatuh pada atau di bawahnya. Bergantung pada ukuran sampel Anda yang mungkin atau mungkin bukan titik tepat dalam data. Jadi, jika satu titik di bawah dan yang berikutnya di atas, kuartil pertama ini tidak benar-benar terdefinisi dengan baik dan titik di antara keduanya dapat berfungsi sama baiknya. Hal yang sama berlaku untuk median ketika ukuran sampel genap. Aturan memilih titik tengah antara titik data di bawah dan di atas. Tetapi tidak ada yang benar-benar mengatakan bahwa pilihan yang diberikan oleh aturan benar-benar lebih baik daripada poin lainnya.
sumber
Bagi Anda yang menggunakan Excel, ada cukup banyak rincian metode versi yang berbeda di sini http://peltiertech.com/WordPress/comparison/
sumber
dalam excel 2016 saya perhatikan, bahwa seseorang dapat memperoleh nilai kuartil yang benar jika:
sumber