Plot qq dapat digunakan untuk memvisualisasikan seberapa mirip dua distribusi itu (misalnya memvisualisasikan kesamaan distribusi ke distribusi normal, tetapi juga untuk membandingkan dua distribusi data artibrary). Apakah ada statistik yang menghasilkan ukuran numerik yang lebih obyektif yang mewakili kesamaan mereka (lebih disukai dalam bentuk normal (0 <= x <= 1))? Koefisien Gini misalnya digunakan dalam ekonomi ketika bekerja dengan kurva Lorenz; apakah ada sesuatu untuk plot QQ?
sumber
Saya baru-baru ini menggunakan korelasi antara CDF empiris dan CDF yang dipasang untuk mengukur good-of-fit, dan saya ingin tahu apakah pendekatan ini juga berguna dalam kasus saat ini, yang seperti yang saya pahami melibatkan membandingkan dua set data empiris. Interpolasi mungkin diperlukan jika ada jumlah pengamatan yang berbeda antara set.
sumber
Saya akan mengatakan bahwa cara kanonik lebih untuk membandingkan dua distribusi akan menjadi tes chi-squared. Statistiknya tidak dinormalisasi, dan itu tergantung pada bagaimana Anda memilih tempat sampah. Poin terakhir tentu saja dapat dilihat sebagai fitur, bukan bug: memilih nampan secara tepat memungkinkan Anda untuk melihat lebih dekat kesamaan di ekor daripada di tengah distribusi, misalnya.
sumber
Ukuran yang cukup langsung dari "kedekatan" dengan linearitas dalam plot QQ adalah statistik uji Shapiro-Francia (yang terkait erat dengan Shapiro-Wilk yang lebih dikenal dan dapat dianggap sebagai perkiraan sederhana untuk itu).
Statistik Shapiro-Francia adalah korelasi kuadrat antara nilai data yang diurutkan dan statistik urutan normal yang diharapkan (kadang-kadang diberi label "kuantil teoretis") - yaitu, itu harus kuadrat dari korelasi yang Anda lihat dalam plot, yang cukup langsung ukuran ringkasan.
(Shapiro-Wilk serupa tetapi memperhitungkan korelasi di antara statistik ordo; ia memiliki interpretasi yang mirip dengan Shapiro-Francia dan cukup berguna seperti ringkasan plot QQ.)
Either way, untuk ringkasan nomor tunggal dari apa yang ditunjukkan plot QQ, salah satunya bisa menjadi cara yang cocok untuk meringkas plot.
sumber