Apa itu 'bagplot', atau 'boxplot bivariat'?

11

Saya telah menemukan sebuah makalah yang memperkenalkan versi multidimensi (bivariat sini) dari boxplot - bagplot. Apa sebenarnya bagplot itu? Saya dapat melihat serangkaian poligon bersarang berdasarkan simpul, salah satu poligon tersebut dinyatakan sebagai bagplot. Apa ide membangun poligon bersarang? Manakah dari poligon adalah bagplot (pusat atau memegang jumlah rata-rata poin)? Apakah tepi bagplot memiliki beberapa sifat yang berguna (seperti secara khusus membagi set point)?

mbaitoff
sumber
3
Ada sebuah artikel oleh Rousseeuw, Pits dan Tukey dalam Statistik Amerika yang menjelaskan ini. Untuk beberapa alasan, saya mengalami kesulitan menempelkan tautan, tetapi Googling "bagplot" dan "Tukey" akan menemukannya
Peter Flom - Reinstate Monica
1
Hanya menemukannya dengan harga yang keterlaluan. Masih mencari.
mbaitoff
1
Jika Anda memiliki akses ke perpustakaan yang layak, mereka harus memilikinya. Ahli statistik Amerika cukup banyak berlangganan. Ada juga sesuatu di quora, tetapi saya tidak melihatnya.
Peter Flom - Reinstate Monica
2
Rousseeuw dan Ruts memiliki artikel lain online selain dari American Statistician dalam format postscript gratis.
Andy W
@AndyW, Meminta Anda sebagai sesama SPSS: bagaimana menurut Anda adalah mungkin untuk melakukannya melalui GPL? Apakah Anda akan menciptakan kode untuk kami SPSSers?
ttnphns

Jawaban:

13

Berikut ini contoh dengan catatan:

Berikut adalah artikel The Bagplot: A Bivariate Boxplotoleh Peter J. Rousseeuw, Ida Ruts & John W. Tukey dari The American Statistician: http://venus.unive.it/romanaz/ada2/bagplot.pdf

Dari abstrak artikel itu:

"Median kedalaman" adalah lokasi terdalam, dan dikelilingi oleh "tas" yang berisi pengamatan n / 2 dengan kedalaman terbesar. Memperbesar tas dengan faktor 3 menghasilkan "pagar" (yang tidak diplot). Pengamatan antara tas dan pagar ditandai oleh lingkaran abu-abu terang, sedangkan pengamatan di luar pagar ditandai sebagai outlier. Bagplot memvisualisasikan lokasi, penyebaran, korelasi, kemiringan, dan ekor data.

Berikut ilustrasi bagian-bagian utama:

masukkan deskripsi gambar di sini

Diskusi tambahan dapat ditemukan dalam hal berikut:

Dari dokumen bantuanaplpack paket (untuk Rpengguna):

Bagplot adalah generalisasi bivariat dari boxplot yang terkenal. Ini telah diusulkan oleh Rousseeuw, Ruts, dan Tukey. Dalam kasus bivariat kotak boxplot berubah menjadi cembung lambung, kantong bagplot. Di dalam tas ada 50 persen dari semua poin. Pagar memisahkan titik di pagar dari titik di luar. Itu dihitung dengan menambah tas. Lingkaran didefinisikan sebagai poligon cembung yang mengandung semua titik di dalam pagar. Jika semua titik berada pada garis lurus, Anda akan mendapatkan boxplot klasik. bagplot () plot bagplot yang sangat mirip dengan yang dijelaskan dalam Rousseeuw et al. Keterangan: Median dua dimensi didekati. Ada kesulitan yang diketahui dengan set data kecil (Tapi saya pikir itu tidak bijaksana untuk membuat ringkasan (grafis) misalnya 10 poin.)

Jika orang ingin memplot banyak plot (overlappIng), akan lebih mudah jika plotnya semi-transparan. Untuk alasan ini bendera transparansi telah ditambahkan ke perintah bagplot. Jika transparansi == BENAR lapisan alfa diatur ke '99' (hex). Ini menyebabkan bagplots tampak semi-transparan, tetapi HANYA jika perangkat output adalah PDF dan dibuka menggunakan: pdf (file = "filename.pdf", version = "1.4"). Untuk alasan ini, standarnya adalah transparansi == SALAH. Fitur ini serta argumen untuk menentukan warna yang berbeda telah diusulkan oleh Wouter Meuleman.

Dan sebuah contoh:

library(aplpack)
attach(mtcars)
bagplot(wt, mpg, xlab="Car Weight", 
        ylab="Miles Per Gallon",
        main="Bagplot Example", 
        transparency = TRUE, 
        show.whiskers = FALSE, 
        # note that data a 'fence' separates inliers from outliers, 
        # and a 'loop' indicates the points outside the bag but 
        # inside the fence. In the 'bag' are 50 percent of all 
        # points
        show.loophull = TRUE, # draw 'loop'?
        show.baghull = TRUE)  # draw 'bag'?

masukkan deskripsi gambar di sini

Pertanyaan-pertanyaan Terkait:

Ben
sumber
4
Pembaruan: seseorang membuat geom ggplot2 untuk ini: gist.github.com/benmarwick/00772ccea2dd0b0f1745 . mungkin pengguna giat dapat mengubah ini menjadi sebuah paket?
shadowtalker