Kuartil di Excel

10

Saya tertarik dengan definisi kuartil yang biasanya digunakan saat Anda menggunakan statistik dasar. Saya memiliki buku tipe Stat 101 dan hanya memberikan definisi intuitif. "Sekitar seperempat dari data jatuh pada atau di bawah kuartil pertama ..." Tapi, itu memberikan contoh di mana ia menghitung Q1, Q2, dan Q3 untuk set data

5, 7, 9, 10, 11, 13, 14, 15, 16, 17, 18, 18, 20, 21, 37

Karena ada 15 lembar data, ia memilih 15 sebagai median, Q2. Ini kemudian membagi data yang tersisa menjadi dua bagian, 5 hingga 14, dan 16 hingga 37. Masing-masing berisi 7 bagian data dan mereka menemukan median masing-masing set, 10 dan 18, masing-masing sebagai Q1 dan Q3. Beginilah cara saya menghitungnya sendiri.

Saya melihat artikel Wikipedia dan memberikan 2 metode. Satu setuju dengan yang di atas, dan satu mengatakan Anda juga bisa memasukkan median 15 di kedua set (tetapi Anda tidak akan menyertakan median jika itu adalah rata-rata dari dua angka tengah dalam kasus jumlah poin data yang genap). Ini semua masuk akal bagi saya.

Tapi, kemudian saya memeriksa Excel untuk melihat bagaimana Excel menghitungnya. Saya menggunakan Excel 2010, yang memiliki 3 fungsi berbeda. Kuartil tersedia di 2007 dan versi sebelumnya. Sepertinya mereka ingin Anda berhenti menggunakan ini pada 2010 tetapi masih tersedia. Quartile.Inc baru tetapi setuju dengan Quartile sejauh yang saya tahu. Dan, ada Kuartil. Juga. Kedua 2 terakhir adalah baru di 2010 saya percaya. Kali ini, saya hanya mencoba menggunakan bilangan bulat 1, 2, 3, ..., 10. Saya berharap Excel memberi median 5,5, Q1 dari 3, dan Q3 dari 8. Metode dari buku statistik, juga karena kedua metode di Wikipedia akan memberikan jawaban ini, karena median adalah rata-rata dari dua angka tengah. Excel memberi

quartile number, Quartile.Inc, Quartile.Exc
1,               3.25,         2.75 
2,               5.5,          5.5
3,               7.75,         8.25

Tak satu pun dari ini setuju dengan apa yang saya bicarakan sebelumnya.

Deskripsi dalam file bantuan untuk Excel adalah:

Quartile.Inc - Mengembalikan kuartil dari kumpulan data, berdasarkan nilai persentil dari 0..1, inklusif.

Quartile.Exc - Mengembalikan kuartil kumpulan data, berdasarkan nilai persentil dari 0..1, eksklusif.

Adakah yang bisa membantu saya memahami definisi yang digunakan Excel ini?

Grafik
sumber
5
Ilustrasi hebat lainnya mengapa tidak menggunakan Excel untuk statistik apa pun. :-)
Wayne
1
Teman jangan biarkan teman menggunakan Excel untuk statistik. Sedih tapi benar
Chris Beeley

Jawaban:

11

Biasanya, peringkat (antara dan untuk data) dikonversi ke persen melalui rumusr1nnp

p=100rαn+12α

untuk beberapa "posisi posisi" yang telah ditentukan sebelumnya antara dan , inklusif. Memecahkan untuk dalam hal memberiα01rp

r=(n+12α)(p/100)+α.

Excel secara historis menggunakan untuk fungsi dan fungsinyaα=1PERCENTILEQUARTILE . The dokumentasi online untuk QUARTILE.INCdan QUARTILE.EXCtidak berguna, jadi kita harus membalik-insinyur apa fungsi ini lakukan.

Misalnya, dengan data , kami memiliki dan untuk tiga kuartil. Menggunakan dalam rumus sebelumnya menghasilkan peringkat , , dan , mereproduksi hasil untuk .(1,2,3,4,5,6,7,8,9,10)n=10p{25,50,75}α=19(0.25)+1=3.259(0.50)+1=5.59(0.75)+1=7.75QUARTILE.INC

Jika sebaliknya kita menetapkan peringkat yang sesuai adalah , , dan , mereproduksi hasil untuk .11 ( 0.25 ) = 2.75 11 ( 0.50 ) = 5.5 11 ( 0.75 ) = 8.25α=011(0.25)=2.7511(0.50)=5.511(0.75)=8.25QUARTILE.EXC

Pengujian lebih lanjut pada bagian Anda (saya tidak memiliki versi Excel terbaru) dapat menetapkan validitas tebakan saya bahwa kedua versi fungsi kuartil ini ditentukan oleh dua nilai ( ) ekstrem ini dariα .

By the way, peringkat fraksional dikonversi menjadi nilai data dengan cara interpolasi linier. Prosesnya dijelaskan dan diilustrasikan dalam catatan mata kuliah saya di Percentiles dan EDF Plots - lihat di dekat bagian bawah halaman itu. Ada juga tautan ke lembar kerja Excel yang menggambarkan perhitungan.

Jika Anda ingin menerapkan fungsi persentil umum di Excel , inilah makro VBA untuk melakukannya:

'
' Converts a percent, computed using plotting position constant A,
' into a percent appropriate for the Excel Percentile() and
' Quartile() functions.  (The default value of A for Excel is 1;
' most values in use are between 0 and 0.5.)
'
Public Function PercentileA(P As Double, N As Integer, A As Double) As Double
    If N < 1 Or A < 0# Or A > 1# Or P < 0# Or P > 1# Then
        Exit Function
    End If
    If N < 2 Then
        PercentileA = 0.5
    Else
        PercentileA = ((N - 2 * A + 1) * P + A - 1) / (N - 1)
    End If
End Function

Ini mengubah persentase nominal (seperti 25/100) menjadi persen yang akan menyebabkan PERCENTILEfungsi Excel mengembalikan nilai yang diinginkan. Ini dimaksudkan untuk digunakan dalam formula sel, seperti pada =PERCENTILE(Data, PercentileA(0.25, Count(Data), 0.5)).

whuber
sumber
Perhatikan bahwa setelah Anda benar-benar memahami apa yang dilakukan Excel, Anda dapat menggunakannya secara efektif untuk pekerjaan statistik.
whuber
5
Jika saya dengan humor tidak setuju dengan komentar Anda: Excel dapat digunakan secara efektif untuk pekerjaan statistik, jika Anda seorang ahli statistik yang dapat membuktikan dari prinsip pertama apa yang harus dilakukan, maka balikkan metode metode Excel untuk menentukan apa yang sebenarnya dilakukan. Ketika Anda sebagus itu, sebagian besar alat apa pun akan berhasil. Meskipun saya juga menunjukkan bahwa di utas ini, 100% penyihir yang terlibat dalam diskusi ini sejauh ini tidak memiliki akses ke versi terbaru dari Excel, jadi tidak mungkin untuk benar-benar menggunakannya.
Wayne
Sentuh, @Wayne. (Tetapi beberapa dari kita masih menggunakan versi Excel yang lebih lama :-).)
whuber
1
Whuber, terima kasih telah berbagi solusi VBA. Ini akan sangat membantu. Sebagai seseorang yang perlu melakukan Statistik tetapi terjebak dengan Excel sebagai satu-satunya alat yang tersedia (ya, saya sudah mencoba R, tetapi tidak bisa menggerakkan kepala), saya menghargai alat untuk membantu menekuk Excel dengan kebutuhan saya.
dav
4

Tampaknya bagi saya bahwa Excel quartile.incsetuju dengan yang asli quartile, yang setuju dengan standar R dan definisi lainnya.

Dengan petunjuk bermanfaat dari whuber, saya menemukan bahwa Excel quartile.exctampaknya setuju (pada kasus 1..10) dengan type=6definisi R tentang kuantil:

   > For types 4 through 9, Q[i](p) is a continuous function of p, with
    > gamma = g and m given below. The sample quantiles can be obtained
    > equivalently by linear interpolation between the points (p[k],x[k])
    > where x[k] is the kth order statistic. Specific expressions for p[k]
    > are given below.
    > 
    > ...
    > 
    > 
    > Type 6 m = p
    >       .p[k] = k / (n + 1). Thus p[k] = E[F(x[k])].
    >       This is used by Minitab and by SPSS.

Yang tampaknya membuat jawaban untuk pertanyaan Anda: "Ya, Minitab dan SPSS lakukan."

Wayne
sumber
Bukankah R memiliki sembilan definisi kuantil? (+1 untuk hasil edit, btw)
whuber
@whuber: Tidak memperhatikan pria di balik tirai! (Saya akan mengedit tanggapan saya. Pada pemeriksaan lebih lanjut, itu cocok dengan salah satu definisi R lainnya, yang jelas apa yang digunakan Minitab dan SPSS. Terima kasih!)
Wayne
2

Saya pikir rasa exc quartile hanya mengabaikan 5 dan 37 (min dan maks dalam data asli Anda).

Di Stata, baik versi default dan alternatif memberi Anda nilai quartile.exc dengan data ini.

Dimitriy V. Masterov
sumber
Tebakan ini tampaknya tidak konsisten dengan dokumentasi yang menyatakan bahwa maks dan min memang dapat dikembalikan oleh QUARTILE.EXC.
whuber
Di versi Excel 2010 saya, QUARTILE.EXC (rentang sel, k) akan mengembalikan #NUM! kecuali k = {1,2,3}, yang sesuai dengan persentil ke-25, ke-50, dan ke-75 sesuai dengan menu pop-up yang muncul. QUARTILE asli juga akan menerima 0 dan 4 sebagai argumen kedua, yang sesuai dengan min dan maks.
Dimitriy V. Masterov
1
Dokumentasi menyatakan "Jika quart ≤ 0 atau jika quart ≥ 4, QUARTILE.EXC mengembalikan nilai kesalahan #NUM !." Sepertinya itu benar. Pernyataan kedua "MIN, MEDIAN, dan MAX mengembalikan nilai yang sama dengan QUARTILE.EXC ketika quart sama dengan 0 (nol), 2, dan 4, masing-masing" masing-masing tampak salah kecuali saya kehilangan sesuatu. Berantakan sekali!
Dimitriy V. Masterov
nn11#NUM!PERCENTILE
1
3 rasa persentil berperilaku sama seperti kuartil bagi saya. Untuk data 5-37, PERCENTILE.EXC (rentang, k) memberikan #NUM! untuk k = {0,1}. Untuk k = 0,25, PERCENTILE.EXC memberikan 10. Jika saya membuang 5 dan 37, itu memberi 10.5, yang setuju dengan 2 cara lainnya.
Dimitriy V. Masterov
2

Banyak hal detail yang menarik tetapi untuk kembali ke pertanyaan awal, saya tidak melihat bahwa dua cara yang sedikit berbeda yang mungkin tidak memberikan jawaban yang persis sama benar-benar penting. Kuatil pertama adalah titik di mana 25% dari pengamatan jatuh pada atau di bawahnya. Bergantung pada ukuran sampel Anda yang mungkin atau mungkin bukan titik tepat dalam data. Jadi, jika satu titik di bawah dan yang berikutnya di atas, kuartil pertama ini tidak benar-benar terdefinisi dengan baik dan titik di antara keduanya dapat berfungsi sama baiknya. Hal yang sama berlaku untuk median ketika ukuran sampel genap. Aturan memilih titik tengah antara titik data di bawah dan di atas. Tetapi tidak ada yang benar-benar mengatakan bahwa pilihan yang diberikan oleh aturan benar-benar lebih baik daripada poin lainnya.

Michael R. Chernick
sumber
α1/31/2
0

Bagi Anda yang menggunakan Excel, ada cukup banyak rincian metode versi yang berbeda di sini http://peltiertech.com/WordPress/comparison/

Peter
sumber
2
Akan lebih baik jika Anda bisa merangkumnya dalam jawaban Anda. Sementara tautan mungkin menjawab pertanyaan, mereka terkadang ketinggalan zaman dalam hal mana jawaban Anda tidak akan membantu pembaca di masa mendatang.
Andy
0

dalam excel 2016 saya perhatikan, bahwa seseorang dapat memperoleh nilai kuartil yang benar jika:

  • kumpulan data memiliki jumlah ganjil entri: gunakan QUARTILE.EXC
  • kumpulan data memiliki jumlah entri genap: gunakan rata-rata QUARTILE.EXC dan QUARTILE.INC
Max Knyazeff
sumber
1
Mengingat berapa banyak definisi kuantil yang dibuktikan dalam beberapa jawaban lain, dapatkah Anda menjelaskan apa yang Anda maksud dengan nilai yang benar?
mdewey