Untuk bagian dari pertanyaan pekerjaan rumah, saya diminta untuk menghitung rata-rata yang dipangkas untuk dataset dengan menghapus pengamatan terkecil dan terbesar, dan untuk menafsirkan hasilnya. Mean dipangkas lebih rendah dari rata-rata tidak terpangkas.
Penafsiran saya adalah ini karena distribusi yang mendasarinya condong positif, sehingga ekor kiri lebih padat daripada ekor kanan. Sebagai hasil dari kemiringan ini, menghapus datum tinggi menyeret rata-rata lebih dari menghapus yang rendah mendorongnya, karena, secara informal, ada lebih banyak data rendah "menunggu untuk menggantikannya." (Apakah ini masuk akal?)
Lalu saya mulai bertanya-tanya bagaimana persentase pemangkasan memengaruhi ini, jadi saya menghitung rata-rata yang dipangkas untuk berbagai . Saya mendapatkan bentuk parabola yang menarik:
Saya tidak yakin bagaimana menafsirkan ini. Secara intuitif, sepertinya kemiringan grafik harus (sebanding dengan) kemiringan negatif dari bagian distribusi dalam titik data median. (Hipotesis ini cocok dengan data saya, tetapi saya hanya memiliki , jadi saya tidak terlalu percaya diri.)
Apakah jenis grafik ini memiliki nama, atau apakah itu biasa digunakan? Informasi apa yang dapat kita peroleh dari grafik ini? Apakah ada interpretasi standar?
Untuk referensi, datanya adalah: 4, 5, 5, 6, 11, 17, 18, 23, 33, 35, 80.