Saya sedang mengerjakan buku teks statistik sambil belajar R dan saya mengalami batu sandungan pada contoh berikut:
Setelah melihat ?quantile
saya mencoba untuk membuat ulang ini di R dengan yang berikut:
> nuclear <- c(7, 20, 16, 6, 58, 9, 20, 50, 23, 33, 8, 10, 15, 16, 104)
> quantile(nuclear)
0% 25% 50% 75% 100%
6.0 9.5 16.0 28.0 104.0
Mengingat bahwa teks dan R memiliki hasil yang berbeda, saya mengumpulkan bahwa R menggunakan median dalam perhitungan kuartil pertama dan ketiga.
Pertanyaan:
Haruskah saya memasukkan median dalam menghitung kuartil pertama dan ketiga?
Lebih khusus lagi, apakah buku teks atau R sudah benar? Jika buku teks ini sudah benar, apakah ada cara untuk mencapai ini dengan benar di R?
Terima kasih sebelumnya.
quantile
tipe 1, 2, dan 6 akan mereproduksi mereka untuk dataset dengan ukuran khusus ini . Tak satu pun dariR
metode sesuai dengan buku Anda. (Orang bertanya-tanya tentang kualitas teks ini ...)quantile
.?quantile
Jawaban:
Buku teks Anda bingung. Sangat sedikit orang atau perangkat lunak yang mendefinisikan kuartil dengan cara ini. (Itu cenderung membuat kuartil pertama terlalu kecil dan kuartil ketiga terlalu besar.)
The
quantile
fungsi dalamR
mengimplementasikan sembilan cara yang berbeda untuk quantiles menghitung! Untuk melihat yang mana dari mereka, jika ada, yang sesuai dengan metode ini, mari kita mulai dengan mengimplementasikannya. Dari deskripsi kita dapat menulis suatu algoritma, pertama secara matematis dan kemudian diR
:Pesan data .x1≤ x2≤ ⋯ ≤ xn
Untuk setiap set data median adalah nilai tengahnya ketika ada sejumlah nilai ganjil; jika tidak, ini adalah rata-rata dari dua nilai tengah ketika ada nilai genap.
R
'smedian
fungsi menghitung ini.Indeks nilai tengah adalah . Bila tidak integer, adalah median, di mana dan adalah dibulatkan ke bawah dan ke atas. Kalau tidak, ketika adalah bilangan bulat, adalah median. Dalam hal ini, ambil dan . Dalam kedua kasus, adalah indeks nilai data segera di sebelah kiri median dan adalah indeks nilai data segera di sebelah kanan median.( x l + x u ) / 2 l u m m x m l = m - 1 u = m + 1 l um = ( n + 1 ) / 2 ( xl+ xkamu) / 2 l kamu m m xm l=m−1 u=m+1 l u
"Kuartil pertama" adalah median dari semua yang . "Kuartil ketiga" adalah median dari yang . i ≤ l ( x i ) i ≥ uxi i≤l (xi) i≥u
Berikut ini adalah implementasinya. Ini dapat membantu Anda melakukan latihan Anda di buku pelajaran ini.
Misalnya, output
quart(c(6,7,8,9,10,15,16,16,20,20,23,33,50,58,104))
setuju dengan teks:Mari kita hitung kuartil untuk beberapa dataset kecil menggunakan semua sepuluh metode: sembilan di
R
dan buku teks:Ketika Anda menjalankan ini dan cek, Anda akan menemukan bahwa nilai-nilai buku tidak setuju dengan salah satu
R
output untuk semua tiga ukuran sampel. (Pola ketidaksepakatan berlanjut dalam siklus periode tiga, menunjukkan bahwa masalah tetap ada, tidak peduli seberapa besar sampel itu.)Buku teks itu mungkin telah salah mengartikan metode komputasi "engsel" John Tukey (alias "perempat"). Perbedaannya adalah bahwa ketika memisahkan dataset di sekitar median, ia memasukkan median di kedua bagian. Itu akan menghasilkan dan untuk dataset contoh.289.5 28
sumber
Dalam bidang statistik (yang saya ajarkan, tetapi di mana saya bukan seorang peneliti), perhitungan kuartil khususnya ambigu (dengan cara yang tidak selalu berlaku untuk kuantil, lebih umum). Ini memiliki banyak sejarah di belakangnya, sebagian karena penggunaan (dan mungkin penyalahgunaan) rentang antar-kuartil (IQR), yang tidak sensitif terhadap pencilan, sebagai pengecekan atau alternatif untuk standar deviasi. Ini tetap merupakan kontes terbuka, dengan tiga metode berbeda untuk menghitung Q1 dan Q3 menjadi ko-kanonik.
Seperti yang sering terjadi, artikel Wikipedia memiliki ringkasan yang masuk akal: https://en.m.wikipedia.org/wiki/Quartile Teks Larson dan Farber, seperti kebanyakan teks statistik dasar, menggunakan apa yang dijelaskan dalam artikel Wikipedia sebagai " Metode 1. " Jika saya mengikuti deskripsi di atas, r menggunakan "Metode 3". Anda harus memutuskan sendiri mana yang sesuai secara kanonik di bidang Anda sendiri.
sumber