Jika Anda menetapkan sebagai versi yang diurutkan dari data asli Anda , maka median didefinisikan sebagai:O1,O2,…,ONX1,X2,…,XN
M e d i a n ({ O1, O2, ... , ON} ) = { O( N+ 1 ) / 2( ON/ 2+ ON/ 2+1) / 2saya f N i s o d d o t h e r w i s e
Tanpa memesan data Anda, Anda dapat menggunakan definisi median geometrik untuk menentukan median dalam satu dimensi:
M e d i a n ({ X1, X2, ... , XN} ) = argminy∑i = 1N∣∣Xsaya- y∣∣
Perhatikan bahwa ini tidak serta merta menentukan median unik ketika ada beberapa titik genap; misalnya angka apa saja mengoptimalkan tujuan dengan .X = { 2 , 3 , 4 , 5 }y∈ [ 3 , 4 ]X= { 2 , 3 , 4 , 5 }
Salah satu cara alternatif untuk mengekspresikan mean adalah estimasi "kuadrat terkecil":
Memilih untuk menjadi rata-rata memberikan nilai terkecil dari jumlah kesalahan kuadrat.m
Sekarang median dapat dinyatakan sebagai estimasi "penyimpangan paling tidak absolut":
Memilih untuk menjadi median memberikan nilai terkecil dari jumlah kesalahan absolut.m
sumber
Median adalah nilai yang sesuai dengan setengah kuantil, yaitu setengah dari nilai lebih tinggi, setengah lebih rendah (maafkan saya karena mengabaikan kasus dengan kesetaraan atau ketika set bahkan ...). Sedemikian rupa sehingga mengingat pdf dari kumpulan data diketahui, maka distribusi kumulatif mudah dievaluasi. Memperhatikan fungsi ini, lalu X 1 ⋅ X n P X m e d i a n = P - 1 X ( 1pX X1⋅Xn PX
Ambil contoh kasus untuk sudut dalam metode ini yang digunakan dalam makalah tinjauan ini untuk pemerataan histogram. Panel kiri bawah menunjukkan pdf dari sudut dalam satu set gambar alami. adalah distribusi kumulatif dan median adalah nilai sesuai dengan nilai , yaitu sekitar dalam kasus itu.P ( θ ) θ 1 / 2 0p(θ) P(θ) θ 1/2 0
sumber