Interpretasi plot biola

9

Saya membandingkan distribusi kelompok yang berbeda menggunakan plot biola, namun sebagian besar sumber daya online yang saya temukan hanya terkait dengan cara membuat plot dan interpretasi yang sangat mendasar dari hasil (variasi median, data dikelompokkan atau tidak).

Saya mencari contoh terperinci yang bisa saya ikuti sebagai pedoman saya untuk menginterpretasikan plot biola dengan benar.

Gago-Silva
sumber

Jawaban:

9

Plot biola hanyalah histogram (atau lebih sering varian yang dihaluskan seperti kepadatan kernel) diputar di sisinya dan dicerminkan. Buku teks apa pun yang mengajarkan Anda bagaimana menafsirkan histogram harus memberi Anda intuisi yang Anda cari. Sunting sesuai saran Nick Cox: Freedman, Pisani, Purves, Statistics mencakup histogram.

Sejauh menafsirkannya dengan cara yang lebih formal, inti dari grafik distribusi adalah untuk melihat hal-hal yang mungkin ditipu oleh uji statistik.

Satu hal yang saya suka lakukan dengan plot biola adalah menambahkan garis untuk median, rata-rata, dll. Kadang-kadang saya akan menempatkan boxplot sehingga saya bisa melihat lebih banyak lagi di ringkasan statistik.

Paling tidak, Anda harus dapat memilih penyimpangan kotor dalam beberapa saat pertama (rata-rata, dispersi, skewness, kurtosis) serta bimodality dan outlier.

Ari B. Friedman
sumber
2
+1, plot yang serupa adalah piramida populasi , distribusi yang direfleksikan hanyalah kategori yang berbeda (dan menggunakan penduga tipe histogram yang lebih khas daripada kde).
Andy W
1
Baik Tukey, analisis data Eksplorasi , maupun Cleveland, Elemen data grafik , tidak banyak bicara tentang histogram: keduanya lebih tertarik dan lebih terkesan oleh representasi lain. Apakah buku-buku itu disinggung di sini? Satu buku yang memuat histogram sebagai dasar adalah Freedman, Pisani, Purves, Statistics .
Nick Cox
1
Sebenarnya, Cleveland memang mengatakan sesuatu tentang histogram. Dia mengatakan bahwa itu adalah grafik yang buruk dan tidak akan digunakan dalam bukunya. :-). Dan F, P dan P adalah buku yang indah.
Peter Flom
1
Saya sudah mengajar dari FPP. Mereka tidak akan secara eksplisit menggunakan OLS untuk memprediksi bidang persegi panjang, karena mereka tidak secara eksplisit melakukan regresi multivariat. Mereka memang memiliki beberapa contoh dalam semangat ini. Sebagai contoh, bagaimana jika Galileo telah mencoba untuk memprediksi waktu t yang dibutuhkan suatu objek jatuh dari ketinggian h dengan regresi linier? Anda mendapatkan kotak paling cocok, tapi tentu saja kebenarannya adalah - moral dari cerita ini adalah untuk selalu melihat residu. t=ch
Michael Lugo
1
@TrevorAlexander Itu pertanyaan yang bagus. Saya tidak mengetahui ada literatur yang menunjukkan interpretasi yang lebih baik ketika dicerminkan, tetapi mereka memang terlihat lebih bagus daripada histogram dalam orientasi vertikal, setidaknya bagi mata saya.
Ari B. Friedman