Apa interpretasi rentang interkuartil?

9

Saya memiliki pengukuran harian nitrogen dioksida selama satu tahun (365 hari) dan interkuartil (IQR) adalah 24 mikrogram per meter kubik. Apa arti "24" dalam konteks ini, selain dari definisi IQR yang merupakan perbedaan antara persentil ke-25 dan ke-75 ? Bagaimana Anda menjelaskan angka ini kepada wartawan, misalnya?

Terima kasih

pengguna2742
sumber
apa artinya atau median?
mpiktas

Jawaban:

18

Dari definisi, ini mendefinisikan rentang penyihir memegang 75-25 = 50 persen dari semua nilai yang diukur.

: (median-24/2, median + 24/2). Median harus ditulis di suatu tempat dekat IQR ini.
Tentu saja di atas salah, sepertinya saya masih tidur ketika menulis ini; maaf atas kebingungan. Memang benar bahwa IQR adalah lebar rentang yang menampung 50% data, tetapi tidak berpusat pada median - orang perlu mengetahui Q1 dan Q3 untuk melokalisasi kisaran ini.

Secara umum IQR dapat dilihat sebagai nonparametrik (= ketika kita tidak berasumsi bahwa distribusi Gaussian) setara dengan standar deviasi - keduanya mengukur penyebaran data. (Setara tidak sama, untuk SD, (mean- , mean + ) memegang 68,2% dari data yang terdistribusi secara normal).σσ

EDIT: Seperti misalnya, ini adalah tampilannya pada data normal; garis merah menunjukkan , rentang yang ditunjukkan oleh kotak pada plot kotak menunjukkan IQR, histogram menunjukkan data itu sendiri: Anda dapat melihat keduanya menunjukkan penyebaran yang cukup baik; rentang menampung 68,3% data (seperti yang diharapkan). Sekarang untuk data non-normal , penyebaran SD diperlebar karena ekornya yang panjang dan asimetris dan menampung 90,5% data! (IQR memegang 50% dalam kedua kasus dengan definisi)±1σteks alternatif
±1σ
teks alternatif
±1σ

Utsav T
sumber
13

Ini adalah pertanyaan sederhana yang menanyakan jawaban sederhana. Berikut adalah daftar pernyataan, mulai dari yang paling mendasar, dan dilanjutkan dengan kualifikasi yang lebih tepat.

IQR adalah penyebaran bagian tengah dari data.

Tanpa membuat asumsi tentang bagaimana data didistribusikan , IQR mengkuantifikasi jumlah dimana nilai-nilai individu biasanya bervariasi.

IQR terkait dengan "standar deviasi" (SD) yang terkenal: ketika data mengikuti "kurva lonceng," IQR sekitar 35% lebih besar dari SD. (Setara dengan itu, SD sekitar tiga perempat dari IQR.)

Sebagai patokan, nilai data yang menyimpang dari nilai tengah lebih dari dua kali IQR layak mendapat perhatian individu. Mereka disebut "pencilan." Nilai data yang menyimpang dari nilai tengah lebih dari 3,5 kali IQR biasanya diteliti dengan cermat. Mereka kadang-kadang disebut "outlier jauh."

whuber
sumber
6

Rentang interkuartil adalah interval , bukan skalar. Anda harus selalu melaporkan kedua angka, bukan hanya perbedaan di antara keduanya. Anda kemudian dapat menjelaskannya dengan mengatakan bahwa separuh bacaan sampel berada di antara dua nilai ini, seperempat lebih kecil dari kuartil bawah, dan seperempat lebih tinggi dari kuartil atas.

onestop
sumber
4
@onestop Ini mendorong saya untuk berpikir apakah IQR harus berupa interval atau skalar. Dari Wikipedia, ini didefinisikan sebagai skalar dan konsisten dengan apa yang telah saya pelajari.
user2742
2
Saya selalu tahu bahwa IQR adalah perbedaan antara kuartil ke-3 dan ke-1, karenanya skalar.
nico
2
Meskipun IQR dapat didefinisikan sebagai skalar, jika dilaporkan sebagai interval, ia membawa lebih banyak informasi. Misalnya [-1,1] dan [499.501] akan memiliki rentang yang sama, tetapi implikasinya berbeda.
mpiktas
1
(IMHO) IQR adalah skalar: itu adalah panjang interval. Jelas, karena selalu mungkin untuk beralih dari yang kedua (berbaring di himpunan bagian R ^ 2) ke yang pertama (berbaring di R +) tetapi tidak sebaliknya, yang terakhir lebih informatif daripada yang sebelumnya.
glassy
1
Saya berharap ini menjadi kontroversial dan menyadari bahwa itu bukan definisi yang biasa , tetapi saya pikir ini lebih berguna. Dalam pengalaman saya dalam literatur medis, jauh lebih umum untuk melaporkan kuartil sebagai IQR daripada perbedaan di antara mereka, dan saya senang itu terjadi.
onestop
1

Secara kasar, saya akan mengatakan kepada seorang jurnalis bahwa saya bisa menyatakan tingkat harian nitrogen dioksida menjadi yakin, setelah membuang nilai tertinggi dan nilai terendah, bahwa dalam masing-masing dari setengah hari di tahun itu nilai yang diamati adalah tidak melebihi jarak IQR / 2 dari level yang dinyatakan.

Misalnya, jika kuartil pertama dan kuartil ketiga Anda adalah 100 dan 124, Anda dapat mengatakan bahwa level harian adalah 112 (rata-rata 100 dan 124) dan meyakinkan lawan bicara Anda bahwa dalam setengah hari kesalahan yang Anda buat tidak lebih dari 12 .

seperti kaca
sumber
Bisakah Anda menjelaskan perbedaan yang Anda buat antara level "mengamati" dan "menyatakan"? (Saya juga curiga jurnalis yang baik akan terganggu oleh implikasi bahwa Anda "membuang" nilai-nilai dan akan menindaklanjuti dengan beberapa pertanyaan sulit :-).)
whuber
@whuber: Saya menambahkan contoh untuk jawaban saya. Tentang pertanyaan-pertanyaan sulit, saya kira itu muncul bahkan jika Anda menjawab mengacu pada distribusi normal (seperti jawaban lain untuk pertanyaan ini), atau beberapa konsep lain. Bisa lebih sederhana untuk menjelaskan mean 50% -trimmed? Jika demikian, maka katakan bahwa IQR adalah panjang dari rentang pengamatannya
kaca