Seperti yang kita ketahui, warna sinar tertentu tergantung pada frekuensinya (atau panjang gelombang ). Juga, bukankah itu informasi yang pertama kali ditangkap oleh kamera digital? Lalu, mengapa kita menggunakan format seperti RGB (atau CMYK , HSV dll) untuk mewakili warna secara digital?
47
Jawaban:
Saya pikir ada beberapa kesalahpahaman dalam jawaban sebelumnya, jadi inilah yang saya anggap benar. Referensi: Noboru Ohta dan Alan R. Robertson, Colorimetry: Fundamentals and Applications (2005).
Sumber cahaya tidak perlu memiliki frekuensi tunggal. Cahaya yang dipantulkan, yang merupakan sebagian besar dari apa yang kita lihat di dunia, tidak perlu memiliki frekuensi tunggal. Sebaliknya ia memiliki spektrum energi, yaitu, isi energinya sebagai fungsi frekuensi. Spektrum dapat diukur dengan instrumen yang disebut spektrofotometer.
Seperti yang ditemukan pada abad kesembilan belas, manusia melihat banyak spektrum berbeda memiliki warna yang sama. Eksperimen dilakukan di mana cahaya dua spektrum berbeda dihasilkan melalui lampu dan filter dan orang-orang ditanya, apakah warnanya sama? Dengan eksperimen seperti itu, seseorang memverifikasi bahwa orang tidak melihat spektrum, tetapi hanya integral dengan fungsi bobot tertentu.
Kamera digital menangkap respons terhadap cahaya set fotodioda yang ditutupi dengan filter berbeda, dan bukan spektrum yang lebih lengkap yang akan Anda lihat dengan spektrofotometer. Tiga atau empat jenis filter digunakan. Hasilnya disimpan dalam output file mentah oleh kamera, meskipun banyak orang curiga bahwa file mentah "dimasak" pada tingkat yang lebih besar atau lebih kecil oleh produsen kamera (sensor kamera tentu saja sangat berpemilik). Respons fisiologis dapat diperkirakan dengan menerapkan transformasi matriks ke data mentah.
Untuk kenyamanan, alih-alih menggunakan perkiraan respons fisiologis, jenis bilangan tiga kali lipat lainnya digunakan untuk memberi nama warna, misalnya Lab, dijelaskan dalam https://en.wikipedia.org/wiki/Lab_color_space (tetapi perhatikan peringatan di halaman). Seseorang harus membedakan tiga kali lipat yang dapat mengekspresikan kisaran penuh perkiraan tanggapan fisiologis dari yang lain, seperti RGB, yang tidak bisa. Yang terakhir digunakan karena mereka mengekspresikan warna yang dapat ditampilkan layar komputer. Mereka adalah hasil konversi dari tiga kali lipat seperti Lab, atau dari data mentah. CMYK adalah untuk printer.
sumber
Tujuan dari teknisi pencitraan selalu untuk menangkap dengan kamera gambar yang setia dari dunia luar dan menyajikan gambar sedemikian rupa sehingga pengamat melihat gambar hidup yang benar. Tujuan ini belum pernah tercapai. Bahkan gambar terbaik yang dibuat hari ini lemah. Jika tujuan ini ingin dicapai, Anda akan membutuhkan kacamata hitam untuk dengan nyaman melihat gambar vista yang diterangi matahari.
Anda bertanya mengapa kamera tidak menangkap seluruh rentang energi radiasi yang menciptakan respons visual manusia. Mengapa kamera modern hanya menangkap tiga segmen sempit yang kita sebut warna cahaya primer yang merah, hijau dan biru?
Jawabannya termasuk dalam kategori bagaimana kita melihat, yaitu respons visual manusia. Selama bertahun-tahun telah banyak teori yang diajukan tentang bagaimana manusia melihat warna. Sejauh ini semua telah gagal memberikan penjelasan yang memuaskan dari setiap aspek bagaimana kita melihat warna. Rentang panjang gelombang yang mata kita sensitif untuk mencakup kisaran 400 hingga 700 milimikron. Bukan kebetulan bahwa atmosfer bumi transparan untuk kisaran ini.
Ketika kita menatap sumber cahaya, kita tidak dapat membedakan satu panjang gelombang tertentu kecuali itu disajikan sendiri. Ketika kita melihat sumber cahaya putih, kita tidak dapat mengisolasi dan mengidentifikasi warna tertentu. Kombinasi mata / otak kami menginterpretasikan warna cahaya tanpa menganalisis apa yang membentuk campuran frekuensi. Memanfaatkan hal ini, para ilmuwan telah membuktikan melalui eksperimen bahwa dengan mencampurkan hanya tiga warna dalam proporsi yang bervariasi, hampir semua warna dapat dihasilkan. Dengan kata lain, menghadirkan ke mata manusia, dalam berbagai intensitas, campuran merah, hijau dan biru, sebagian besar spektrum warna dapat direproduksi, bukan hanya perkiraan dekat. Ini adalah karya Thomas Young (Inggris 1773 - 1829) berjudul Young Theory of Color Vision.
Berdasarkan teori Young, James Clerk Maxwell (Inggris 1831 - 1879), menunjukkan kepada dunia gambar fotografi warna pertama yang diproduksi. Pada 1855 ia menggunakan tiga proyektor dan menempatkan tiga gambar yang diproyeksikan pada satu layar. Setiap proyektor dilengkapi dengan filter berwarna. Tiga gambar itu masing-masing dari tiga warna primer terang, yaitu, merah, hijau, dan biru. Gambar film yang diproyeksikan dibuat dengan mengambil tiga gambar terpisah pada tiga potong film hitam putih, masing-masing diekspos melalui satu filter dari tiga perdana cahaya.
Sejak hari itu pada tahun 1855, banyak metode untuk membuat dan menampilkan gambar berwarna telah dieksplorasi. Gambar gerak warna awal diproyeksikan gambar warna lemah menggunakan hanya dua warna. Edwin Land (American 1909 - 1991) pendiri Polaroid Corp bereksperimen membuat gambar warna hanya menggunakan dua warna primer. Ini tetap merupakan keingintahuan laboratorium. Sejauh ini, gambar warna paling setia dibuat menggunakan tiga warna primer. Namun, seorang pria, Gabbriel Lippmann (Perancis 1845 - 1921) membuat gambar warna yang indah yang menangkap seluruh spektrum cahaya visual. Dia menemukan metode yang menggunakan film hitam putih dengan dukungan cermin. Cahaya yang mengekspos menembus film, menabrak cermin dan dipantulkan kembali ke dalam film. Jadi paparan dibuat melalui dua transit cahaya yang terbuka. Gambar terdiri dari perak yang disusun dengan jarak yang sama dengan panjang gelombang cahaya yang terbuka. Saat dilihat, film hanya memungkinkan cahaya untuk lewat yang cocok dengan panjang gelombang cahaya yang terbuka. Orang bisa melihat gambar penuh warna yang tidak mengandung pewarna pigmen. Unik dan indah, proses Lippmann tetap tidak praktis. Film dan kamera digital kami kembali ke metode yang digunakan oleh Maxwell. Mungkin, jika Anda mempelajari visi manusia dan teori warna, mungkin Anda akan menjadi orang yang memajukan ilmu pengetahuan kita dan mendapatkan gambar yang benar-benar setia pertama. Film dan kamera digital kami kembali ke metode yang digunakan oleh Maxwell. Mungkin, jika Anda mempelajari visi manusia dan teori warna, mungkin Anda akan menjadi orang yang memajukan ilmu pengetahuan kita dan mendapatkan gambar yang benar-benar setia pertama. Film dan kamera digital kami kembali ke metode yang digunakan oleh Maxwell. Mungkin, jika Anda mempelajari visi manusia dan teori warna, mungkin Anda akan menjadi orang yang memajukan ilmu pengetahuan kita dan mendapatkan gambar yang benar-benar setia pertama.
sumber
Kamu berkata,
Itu tidak benar. Dengan sendirinya, sensor pada sebagian besar kamera digital merespons gelombang frekuensi cahaya yang luas, melampaui apa yang dapat dilihat manusia ke dalam spektrum inframerah dan ultraviolet. Karena sensor menangkap spektrum cahaya yang begitu luas, mereka merupakan diskriminator mengerikan dari panjang gelombang cahaya. Artinya, secara umum, sensor digital melihat hitam dan putih .
Untuk sebagian besar sensor kamera¹, untuk menangkap warna, filter berwarna ditempatkan di depan sensor, yang disebut array filter warna (CFA). CFA mengubah setiap piksel sensor (kadang-kadang disebut sensel ) menjadi sensor cahaya terutama merah, hijau, atau biru. Jika Anda melihat data sensor mentah sebagai gambar hitam dan putih, itu akan tampak bingung, agak seperti gambar kertas hitam-putih setengah-toned. Memperbesar dengan pembesaran tinggi, masing-masing piksel gambar akan memiliki tampilan seperti kotak-kotak.
Menafsirkan kuadrat individu dari data gambar mentah sebagai merah, hijau, atau biru yang sesuai, Anda akan melihat versi warna gambar yang membingungkan, mirip dengan artikel kertas koran setengah ton warna.
Array filter warna Bayer, oleh pengguna Cburnett , Wikimedia Commons. CC BY-SA 3.0
Melalui proses yang disebut demosaicing baik saat menyimpan data gambar di kamera, atau dalam pasca-pemrosesan pada komputer, berbagai data warna dikomputasi secara komputasional untuk membuat gambar warna RGB resolusi penuh. Dalam proses demosaicing, nilai RGB dari setiap piksel dihitung dengan algoritma yang mempertimbangkan tidak hanya nilai piksel, tetapi data dalam piksel terdekat yang mengelilinginya juga.
Kami menggunakan model warna trikromik karena itulah cara manusia memandang warna. Dari artikel Trichromacy Wikipedia'a ,
Jadi, kami membuat kamera yang menangkap apa yang bisa kami lihat, dengan cara yang agak mirip dengan cara kami melihatnya . Misalnya, untuk fotografi tipikal yang bertujuan untuk menangkap dan mereproduksi apa yang kita lihat, tidak masuk akal juga untuk menangkap panjang gelombang inframerah dan ultraviolet.
Tidak semua sensor menggunakan CFA. The Foveon X3 sensor, yang digunakan oleh Sigma DSLR dan kamera mirrorless, bergantung pada fakta bahwa panjang gelombang yang berbeda dari menembus silikon cahaya untuk kedalaman yang berbeda. Setiap piksel pada sensor X3 adalah tumpukan fotodioda pendeteksi merah, hijau, dan biru. Karena setiap piksel benar-benar merupakan sensor RGB, tidak diperlukan demosaicing untuk sensor Foveon.
The Leica M monochrom adalah hanya kamera hitam-putih mahal yang tidak memiliki CFA pada sensor. Karena tidak ada penyaringan cahaya yang masuk, kamera lebih sensitif terhadap cahaya (menurut Leica, 100%, atau 1 stop, lebih sensitif).
sumber
Alasan kamera dan tampilan bekerja di RGB adalah karena retina kami berfungsi seperti itu .
Karena mata kita menyandikan warna dengan komponen-komponen tersebut (RGB), itu adalah sistem yang sangat nyaman (walaupun tentu bukan satu-satunya) untuk menyandikan tidak hanya panjang gelombang murni (yang membentuk kombinasi respons retina yang kurang lebih deterministik untuk setiap komponen kromatik) , tetapi juga warna campuran.
Alasannya adalah "jika ada kombinasi warna yang hanya dapat dikirimkan ke otak sebagai kombinasi dari tiga komponen, saya dapat menipu sistem visual dengan hanya menghadirkan kombinasi tertentu dari komponen-komponen murni yang terisolasi (melalui tampilan RGB) dan membiarkan visual sistem mendekode mereka seolah-olah mereka adalah hal yang nyata.
Sangat menarik untuk dicatat bahwa, karena kita trichromats, sebagian besar sistem warna bersifat tiga dimensi (Lab, HSV, YCbCr, YUV, dll.), Bukan karena sifat fisik intrinsik warna , tetapi karena sifatnya yang sangat intrinsik. sistem visual kita berfungsi.
sumber
Upaya untuk menjawab hanya:
Kita tidak bisa secara praktis menangkap informasi yang cukup untuk menyimpan rincian lengkap, frekuensi demi frekuensi, dari semua panjang gelombang cahaya yang ada, bahkan hanya dalam spektrum yang terlihat. Dengan RGB kita dapat menggambarkan warna piksel hanya menggunakan tiga angka. Jika kita menangkap seluruh spektrum frekuensi cahaya, setiap piksel tidak akan membutuhkan 3 angka, tetapi grafik data. Pengiriman dan penyimpanan data akan sangat besar.
Itu tidak perlu bagi mata kita. Mata kita tidak hanya melihat tiga panjang gelombang tunggal, tetapi masing-masing reseptor "merah", "hijau" dan "biru" menangkap rentang cahaya yang tumpang tindih sebagian:
Tumpang tindih memungkinkan otak kita untuk menginterpretasikan kekuatan relatif dari sinyal sebagai warna yang bervariasi di antara pendahuluan, sehingga sistem penglihatan kita sudah cukup baik dalam memperkirakan panjang gelombang aktual yang diberikan hanya kekuatan sinyal relatif dari tiga pendahuluan. Model warna RGB mereproduksi tingkat informasi yang sama secara memadai.
sumber
Ada dua alasan yang saling berinteraksi.
Alasan (1) adalah bahwa mata (biasanya) menerima banyak panjang gelombang cahaya dari titik tertentu [untuk berbicara]. Cahaya putih, misalnya, sebenarnya [sebagai suatu peraturan] campuran dari banyak panjang gelombang yang berbeda; tidak ada panjang gelombang "putih". Demikian pula, magenta (sering disebut "pink" saat ini (melalui "hot pink")) adalah campuran merah dan biru, tetapi tanpa hijau (yang akan membuatnya tampak putih). Demikian pula lagi, sesuatu yang tampak hijau mungkin memiliki beberapa komponen kapur dan beberapa cyan.
Alasan (2), kemudian, adalah bahwa RGB adalah cara mata manusia bekerja - ia memiliki sensor merah, hijau dan biru.
Dengan demikian, menggabungkan (1) dan (2): untuk mendapatkan otak manusia untuk menafsirkan sinyal cahaya dengan cara yang sama seperti akan menafsirkan sinyal asli, mereka harus dikodekan dalam istilah-istilahnya.
Sebagai contoh, jika (sebaliknya) aslinya adalah (apa yang seseorang akan anggap) cahaya putih, tetapi itu dikodekan menggunakan, katakanlah, sensor violet dan merah - hanya dua - reproduksi akan tampak oleh mata manusia sebagai magenta. Demikian pula, tetapi lebih halus atau halus ... cahaya putih yang merupakan campuran dari berbagai warna ... jika ini dikodekan menggunakan, katakanlah, violet, sensor kuning dan merah ... reproduksi ini akan tampak oleh mata manusia bukan putih murni - sebagai (begitu saja) kuning-off putih. Sebaliknya, itu akan muncul sebagai putih murni untuk alien imajiner [dan memang mungkin untuk beberapa binatang nyata] dengan sensor yang sama (yaitu violet, kuning dan merah) di matanya.
Dengan cara yang sama ... jika aslinya putih - yaitu, campuran dari berbagai warna - maka mata manusia yang memahami ini akan mengkodekan ini dalam hal hanya merah, hijau dan biru ... dan reproduksi hanya menggunakan merah, hijau dan biru (dalam proporsi yang sama) akan tampak oleh persepsi manusia sebagai putih murni - intinya adalah bahwa informasi hilang dalam kedua kasus, tetapi hasil akhirnya tampak sempurna, karena kerugian sesuai. Sayangnya, mereka akan sesuai persis hanya jika sensor [RGB] di kamera memiliki kepekaan kurva persis sama dengan sensor [RGB] di mata manusia [mencatat bahwa setiap sensor diaktifkan oleh berbagai warna] - jika, misalnya , warna kapur mengaktifkan masing-masing sensor merah, hijau dan biru dengan jumlah yang persis sama, di kedua case.
sumber
tl; dr: Jauh lebih mudah untuk mendeteksi cahaya pada tiga bagian spektrum yang luas daripada menganalisis frekuensi secara akurat. Selain itu, detektor yang lebih sederhana berarti bisa lebih kecil. Dan alasan ketiga: ruang warna RGB meniru prinsip operasi mata manusia.
Sebagaimana Max Planck membuktikan setiap panas tubuh memancarkan radiasi dengan berbagai frekuensi. Dia menyarankan dan membuktikan bahwa energi terpancar dalam semburan, yang disebut foton, tidak secara kontinyu seperti yang diduga sebelumnya. Dan sejak hari itu, fisika tidak pernah sama. Satu-satunya pengecualian adalah LASER / MASER ideal yang memancarkan radiasi hanya satu frekuensi dan melepaskan (neon bar, ...) memancarkan radiasi dengan beberapa frekuensi terisolasi.
Distribusi intensitas pada frekuensi disebut spektrum. Demikian pula, detektor juga memiliki spektra mereka, dalam hal ini adalah distribusi respons detektor terhadap radiasi dengan intensitas dinormalisasi.
Seperti yang telah dicatat, cahaya putih adalah putih karena mata kita adalah evolusi-kalibrasi untuk melihat sinar matahari, mulai dari inframerah jauh ke ultraviolet, putih. Leafs, misalnya, berwarna hijau karena mereka menyerap semua frekuensi kecuali untuk bagian, yang kita lihat sebagai hijau.
Tentu saja, ada detektor yang dapat mengumpulkan spektrum dan mengekstrak informasinya. Mereka digunakan dalam spektroskopi emisi optik dan difraksi sinar-X dan teknik fluoresensi, di mana komposisi kimia atau struktur mikro dievaluasi dari spektrum. Untuk fotografi itu berlebihan; kecuali untuk astrophotography, di mana kami ingin mengevaluasi komposisi "kimia" tetapi gambar "diterjemahkan" ke warna palsu. Detektor ini akurat dan besar atau kecil tetapi tidak akurat dan Anda membutuhkan daya komputasi yang lebih besar untuk menganalisisnya.
Mata manusia, atau mata lainnya, bukan itu masalahnya. Kami tidak melihat komposisi kimia, atau ikatan, objek. Di mata ada empat "detektor" yang berbeda:
Jika kita melihat pelangi, atau CD atau DVD, kita akan melihat warna berubah dari merah menjadi ungu. Berkas cahaya untuk bagian pelangi tertentu adalah dari satu frekuensi perticullar. Sinar inframerah tidak terlihat oleh mata kita dan mereka tidak merangsang sel di retina. Meningkatkan frekuensi, balok mulai menggairahkan "sel" merah saja dan warna ic terlihat merah. Meningkatkan frekuensi balok menggairahkan "sel darah merah kebanyakan" dan sedikit "hijau" dan warnanya terlihat oranye. Balok kuning membangkitkan "hijau" sedikit lebih ...
Sensor dalam kamera, CCD atau CMOS, bersemangat dengan sinar cahaya berfrekuensi apa pun, untuk mengambil gambar, mata kita akan melihat warna yang hanya meniru mata manusia - kita gunakan, misalnya, filter Bayes. Ini terdiri dari tiga filter warna dengan spektrum transmisi yang sengaja serupa dengan jenis sel retina kami.
Cahaya yang dipantulkan dari kertas kuning yang disinari oleh Matahari mengeluarkan "merah" sepenuhnya (100%), "hijau" sepenuhnya (100%) dan sedikit "biru" (5%), sehingga Anda melihatnya berwarna kuning. Jika Anda memotretnya, simillar, ucapkan hal yang sama, eksitasi dikumpulkan oleh kamera. Saat melihat gambar di layar, layar mengirimkan 100 foton merah, 100 foton hijau dan 5 foton biru dalam waktu yang sangat singkat ke arah Anda. Tingkat eksitasi retina Anda akan serupa dengan eksitasi yang disebabkan oleh pengamatan langsung dan Anda akan melihat foto kertas kuning.
Ada masalah lain yang harus dipecahkan jika kita ingin mereproduksi warna. Menggunakan RGB colourpace, kami hanya membutuhkan tiga jenis sumber cahaya per piksel. Kita dapat memiliki tiga filter warna (LCD berfungsi seperti ini), kita dapat memiliki tiga jenis LED (panel LED dan OLED menggunakannya), kita dapat memiliki tiga jenis luminofor (CRT menggunakan ini). Jika Anda ingin mereproduksi warna sepenuhnya, Anda akan membutuhkan jumlah filter / sumber tak terbatas per piksel. Jika Anda ingin menggunakan simlify informasi warna-ke-frekuensi itu tidak akan membantu.
Anda juga dapat mencoba mereproduksi warna dengan temperaure-nya. Saya kira Anda hanya dapat mereproduksi warna merah-oranye-kuning-putih dan Anda harus memanaskan setiap piksel ke suhu sekitar 3000 K.
Dan dalam semua kasus teoritis mata Anda masih akan menerjemahkan warna sebenarnya yang sebenarnya ke sinyal RGB dan meneruskannya ke otak Anda.
Masalah lain yang harus dipecahkan adalah bagaimana cara menyimpan data? Gambar 18MPx RGB konvensional terdiri dari tiga matriks 5184x3456 sel, masing-masing titik dengan ukuran 8-bit. Itu berarti 51 MiB file terkompresi per gambar. Jika kita ingin menyimpan spektrum penuh untuk setiap piksel, katakanlah dalam resolusi 8-bit, itu akan menjadi 5184x3456x256 übermatrix yang menghasilkan file terkompresi 4 GiB. Itu berarti menyimpan intensitas 256 frekuensi yang berbeda dalam kisaran 430-770 THz, itu berarti resolusi interval 1,3 THz per saluran.
Sama sekali tidak sepadan dengan usaha jika saya dapat mengatakan ...
sumber
Jawaban singkatnya: Karena panjang gelombang adalah nilai tunggal, dan seluruh rentang warna yang dapat kita rasakan tidak dapat diwakili oleh nilai tunggal, lebih dari dimensi padatan persegi panjang dapat diwakili oleh pengukuran tunggal.
Untuk melanjutkan analogi - Anda bisa mengutip volume padatan, tetapi ada banyak padatan berbeda dengan volume yang sama.
RGB, CMY, HLS, dll., Semuanya menggunakan tiga "dimensi" karena sekarang banyak yang Anda butuhkan untuk menggambarkan warna secara memadai seperti yang terlihat oleh manusia.
Panjang gelombang sama dengan Hue di sistem HLS, tetapi tidak bisa memberi tahu Anda terang atau saturasi.
Re "Juga, bukankah itu ([panjang gelombang]) informasi yang ditangkap pertama kali oleh kamera digital?" , tidak, tidak.
Seperti orang lain telah mencatat kamera digital menangkap intensitas relatif merah, hijau, dan biru. (Dan beberapa telah menggunakan setidaknya satu warna tambahan untuk memberikan diskriminasi yang lebih baik di wilayah kritis merah-ke-hijau.) Mengukur langsung frekuensi cahaya yang masuk akan jauh lebih sulit. Kami hanya tidak memiliki sensor murah yang dapat melakukan itu, tentu saja bukan sensor yang dapat kami buat dalam kotak beberapa juta dari mereka. Dan kita masih membutuhkan cara agar kamera mengukur cahaya dan saturasi.
sumber