Apa matematika di balik properti pengurangan kebisingan median filter?

8

Saya tertarik untuk memahami alasan matematika mengapa mengaplikasikan filter median pada gambar (atau sinyal) menghasilkan pengurangan noise.

zr.
sumber
Efektivitas filter median akan tergantung pada jenis kebisingan. Noise dengan nilai median 0, mis. Aditif white Gaussian noise (AWGN) akan terpotong dengan cukup baik jika diberikan sampel yang cukup. Jika noise adalah bentuk lain dari gangguan (multipath fading), filter median tidak akan membantu.
Nick T

Jawaban:

13

Intuisi: Intuisi adalah ini: Suara Anda adalah beberapa peristiwa atau peristiwa yang jarang terjadi, dan bila dibandingkan dengan peristiwa lain, terlihat seperti pencilan yang seharusnya tidak benar-benar ada di sana.

Misalnya, jika Anda mengukur kecepatan setiap mobil di jalan raya saat mereka melewati Anda dan memplotnya, Anda akan melihat bahwa mereka biasanya berada dalam kisaran katakanlah, mph hingga mph. Namun saat Anda memeriksa data Anda untuk bos Anda, Anda melihat bahwa Anda mencatat kecepatan mph. Nilai ini tidak hanya masuk akal secara fisik untuk kecepatan mobil sebenarnya di jalan raya, tetapi juga menonjol dari sisa data Anda. Mengaitkan peristiwa ini hingga beberapa kesalahan pengukuran aneh, Anda menghapusnya, dan memberikan sisa data Anda kepada bos Anda.50701,000,000

Namun saat Anda melanjutkan pengukuran Anda hari demi hari, Anda memperhatikan bahwa kadang-kadang, Anda mendapatkan pengukuran kecepatan liar itu. Misalnya, selama rentang 1 jam, Anda mengukur 1000 mobil, dan kecepatannya bagus antara dan mph, namun 3 di antaranya memiliki kecepatan mph, mph, dan mph, tidak hanya melanggar undang-undang negara bagian setempat, tetapi juga teori fisika.507023,42412,000,121192,212,121,329,982,321,912

Anda bosan terus-menerus harus masuk, dan menghapus titik-titik data yang keliru yang disebabkan oleh radar murahan Anda dengan tangan. Setelah semua, bos Anda benar-benar hanya tertarik pada statistik kecepatan, tidak begitu banyak setiap nilai aktual. Dia suka membuat histogram yang bagus untuk nya bos.

Angka-angka yang salah dan besar itu semacam 'suara' menurutmu - 'suara' yang disebabkan oleh radar murahan yang kau beli dari toko gadai yang teduh. Apakah aditif kebisingan gaussian white noise? (AWGN). Ya dan tidak - Spektrumnya adalah pita lebar dan putih, tetapi sementara jarang, jarang, dan sangat terlokalisasi. Lebih baik disebut sebagai kebisingan 'garam dan lada', (terutama dalam domain pemrosesan gambar).

Jadi, apa yang dapat Anda lakukan, adalah menjalankan data Anda melalui filter median . Filter median Anda akan mengambil blok katakanlah, poin kecepatan, (poin 1 hingga 5), ​​cari median, dan ludahkan nilai itu sebagai kecepatan 'rata-rata'. Kemudian akan mengambil 5 poin berikutnya, (poin 2 hingga 6), ambil median itu, dan keluarkan ini sebagai rata-rata, dll.5

Apa yang terjadi ketika Anda menemukan salah satu kecepatan Anda yang lebih cepat dari cahaya? Katakanlah 5 kecepatan Anda adalah [45, 65, 50, 999999, 75]. Jika Anda mengambil rata-rata normal, kecepatan 'rata-rata' Anda di sini akan menjadi sesuatu yang cukup besar. Namun jika Anda mengambil median, 'rata-rata' Anda adalah 65. Mana yang paling mendekati rata-rata yang benar-benar Anda coba ukur? Metrik median.

Dengan demikian, jika Anda memfilter data Anda dengan filter median, Anda akan yakin untuk menghapus outlier tersebut - dan dengan demikian Anda dengan setia 'menghilangkan suara' sinyal Anda. Sebaliknya, jika Anda mencoba untuk menghapus kebisingan Anda melalui pemfilteran tradisional, (tidak lain adalah jumlah yang tertimbang bergerak), Anda akan 'menodai' kesalahan di seluruh data Anda, dan tidak menghilangkannya.

Matematika: Matematikanya adalah ini: Pengukuran median adalah apa yang disebut sebagai statistik pesanan . Yaitu, mengembalikan nilai data Anda, di beberapa titik, setelah dipesan. Maks dan min juga merupakan statistik pesanan - keduanya mengembalikan titik ekstrem data Anda setelah dipesan. Mengambil median juga mengembalikan nilai data yang Anda pesan, tetapi langsung dari tengah.

Tetapi mengapa mereka berbeda dari filter rata-rata? Nah, filter berarti menghitung rata-rata menggunakan semua data. Jika Anda perhatikan dari maks, min, dan median, Anda mendapatkan jawaban tanpa menggunakan semua data. Bahkan, semua median lakukan adalah memesan data Anda, dan memilih nilai di tengah. Itu tidak pernah 'menyentuh' outlier, seperti kecepatan besar yang Anda ukur.

Inilah sebabnya mengapa median - statistik pesanan - dapat 'menghilangkan' noise outlier untuk Anda. Suara outlier memisahkan dirinya di depan median, dan median tidak pernah mendekatinya atau mempertimbangkannya, sambil tetap memberi Anda perkiraan kecenderungan sentral yang bagus.

Tarin Ziyaee
sumber
6

Dengan asumsi variabel acak independen dengan distribusi normal, probabilitas bahwa suatu nilai akan melampaui, katakanlah, 2 standar deviasi akan menjadi sekitar 0,01.

Jika Anda memiliki filter median lebar 3, triplet itu harus berisi dua outlier di sisi yang sama dari mean agar pencilan dapat melewatinya. Acara ini memiliki probabilitas 0,00005.20.0052=

Saat median filter bertambah lebar, probabilitas pencilan yang berhasil berkurang secara eksponensial.

MackTuesday
sumber