Apa perbedaan praktis yang relevan antara berbagai metode resampling gambar?

ImageResizeFungsi Mathematica mendukung banyak metode resampling .

Tidak akrab dengan daerah ini, di luar tetangga terdekat, bilinear, biquadratic dan bicubic (yang jelas dari namanya), saya tersesat.

Dapatkah Anda mengarahkan saya ke beberapa sumber yang akan menjelaskan perbedaan dasar (matematis) antara metode ini, dan khususnya menunjukkan perbedaan praktis (misalnya dengan menunjukkan gambar sampel di mana pilihan metode benar-benar penting dan memperkenalkan perbedaan yang nyata)?

_{Saya tidak memiliki latar belakang pemrosesan sinyal, jadi saya lebih suka pengantar yang "lembut" dan ringkas :-)}

Saya akan menyalin di sini daftar ImageResizemetode bagi mereka yang "malas" untuk mengklik tautan:

"Terdekat" tetangga terdekat resampling

"Bilinear" interpolasi bilinear

"Biquadratic" interpolasi spline biquadratic

Interpolasi spline bikubik "bikubik"

"Gaussian" resampling Gaussian

"Lanczos" Metode interpolasi multivarian Lanczos

Interpolasi "kosinus" kosinus

"Hamming" mengangkat-kosinus Hamming interpolasi

"Hann" mengangkat interpolasi Hann-cosinus

"Blackman" tiga istilah umum cosinus terangkat

Interpolasi jendela segitiga "Bartlett"

"Connes" kuadratkan interpolasi Welch

Interpolasi kuadratik "Welch"

"Parzen" interpolasi satu demi satu kubik

"Kaiser" interpolasi Bessel modifikasi tanpa urutan yang dimodifikasi

image-processing Szabolcs
sumber

Pertanyaan itu terlihat terlalu luas bagi saya. Sebaiknya pisahkan menjadi metode tertentu dan ajukan pertanyaan spesifik untuk metode yang Anda miliki masalah.

mirror2image

Agak bersinggungan dengan pertanyaan Anda, Anda mungkin menganggap perbandingan gambar ini menarik: general-cathexis.com/interpolation/index.html

Mr.Wizard

Saya akan memperhatikan bahwa semua metode yang Anda tulis adalah Space Invariant. Saya pikir metode yang lebih modern untuk upsampling adalah Edge Aware dan Space Variant.

Royi

Inilah transformasi kedua dari belakang. Ini disebut transformasi PB dan mengubah gambar dengan memprediksi nilai secara bicubically sesuai dengan probabilitas pada apa yang akan terjadi setelah dilatih pada banyak gambar lainnya. Seperti apa bentuk [hasilnya] [1]. [1]: v1.std3.ru/57/a9/…

MyBushisaNeonJungle

Diberikan gambar dengan bilangan bulat, interpolasi gambar itu pada titik sembarang dapat ditulis sebagai $I(m,n)$ $m,n$ $m',n'$

\tilde{saya} (m^{'}, n^{'}) = \sum_{m = ⌊ m^{'} ⌋ - w + 1}^{⌊ m^{'} ⌋ + w} \sum_{n = ⌊ n^{'} ⌋ - w + 1}^{⌊ n^{'} ⌋ + w} saya (m, n) f (m^{'} - m, n^{'} - n)

$\tilde{I}(m',n')=\sum_{m=\left\lfloor m'\right\rfloor-w+1}^{\left\lfloor m'\right\rfloor+w}\ \sum_{n=\left\lfloor n'\right\rfloor-w+1}^{\left\lfloor n'\right\rfloor+w}I(m,n)\ f(m'-m,n'-n)$

$\tilde{I}$ $\mathcal{I}(x,y)$

$f(m,n)$

Seperti halnya fungsi jendela untuk sinyal temporal, mudah untuk mendapatkan inti dari apa yang dilakukan kernel interpolasi gambar dengan melihat respons frekuensinya. Dari jawaban saya pada fungsi jendela :

Dua faktor utama yang menggambarkan fungsi jendela adalah:

Lebar dari lobe utama (yaitu, pada frekuensi berapa daya adalah setengah dari respon maksimum)

Atenuasi lobus samping (yaitu, seberapa jauh ke bawah adalah lobus samping dari mainlobe). Ini memberitahu Anda tentang kebocoran spektral di jendela.

Ini cukup banyak berlaku untuk kernel interpolasi. Pilihannya pada dasarnya adalah pertukaran antara penyaringan frekuensi (pelemahan sidelobes), lokalisasi spasial (lebar mainlobe) dan mengurangi efek lain seperti dering (efek Gibbs), aliasing, kabur, dll. Misalnya, kernel dengan osilasi seperti karena kernel sinc dan kernel Lanczos4 akan memperkenalkan "dering" pada gambar, sedangkan resampling Gaussian tidak akan memperkenalkan dering.

Berikut ini contoh sederhana dalam Mathematica yang memungkinkan Anda melihat efek dari berbagai fungsi interpolasi:

true = ExampleData[{"TestImage", "Lena"}];
resampling = {"Nearest", "Bilinear", "Biquadratic", "Bicubic", 
   "Gaussian", "Lanczos", "Cosine", "Hamming", "Hann", "Blackman", 
   "Bartlett", "Connes", "Welch", "Parzen", "Kaiser"};
small = ImageResize[true, Scaled[1/4]];

Di sini, truemewakili gambar yang saya anggap setara diskrit dari gambar "tepat" $\mathcal{I}(x,y)$ , dan smallmewakili gambar skala yang lebih kecil $I(m,n)$ (kami tidak tahu bagaimana itu diperoleh). Kami akan interpolasi $I(m,n)$ dengan 4x untuk memberi $\tilde{I}(m',n')$ yang ukurannya sama dengan aslinya. Di bawah ini, saya menunjukkan hasil interpolasi ini dan perbandingan dengan gambar sebenarnya:

masukkan deskripsi gambar di sini

Anda dapat melihat sendiri bahwa fungsi interpolasi yang berbeda memiliki efek yang berbeda. Terdekat dan beberapa lainnya memiliki fitur yang sangat kasar dan Anda pada dasarnya dapat melihat garis bergerigi (lihat gambar ukuran penuh, bukan tampilan kotak). Bicubic, biquadratic dan Parzen mengatasi hal ini tetapi menimbulkan banyak kekaburan. Dari semua kernel, Lanczos tampaknya (secara visual) menjadi yang paling menarik dan yang melakukan pekerjaan terbaik.

Saya akan mencoba mengembangkan jawaban ini dan memberikan contoh yang lebih intuitif menunjukkan perbedaan ketika saya punya waktu. Anda mungkin ingin membaca artikel yang cukup mudah dan informatif ini yang saya temukan di web (peringatan PDF).

Lorem Ipsum
sumber

Apakah saya melihat notasi infiks!?! : ->

Mr.Wizard

@ Mr.Wizard Saya memang mengatakan akan melakukan upaya yang jujur :)

Lorem Ipsum

Apa perbedaan praktis yang relevan antara berbagai metode resampling gambar?

Jawaban: