Mengapa kamera tidak menangkap jangkauan dinamis seperti mata kita?

29

Ketika duduk di sebuah ruangan tanpa lampu menyala, dan saya melihat keluar jendela, saya dapat dengan mudah melihat interior ruangan bahkan jika saya fokus pada pohon di luar.

Mengapa kamera tidak bisa menangkap gambar yang mirip dengan apa yang bisa dilihat mata saya? Saya akan berpikir bahwa kamera yang lebih baru harus dapat menangkap rentang dinamis yang jauh ini dengan mudah. Saya tidak percaya bahwa tampilan adalah masalah jika rentang dinamis ini ditangkap, karena dapat dinormalisasi. Dalam kamera digital saya harus mengatur eksposur yang hanya akan menangkap adegan luar atau dalam adegan dengan benar.

Apakah ini hanya masalah dengan kamera digital atau apakah sama untuk kamera film?

Pertanyaan serupa sudah dibahas di sini. Bagaimana cara menangkap adegan persis seperti yang bisa dilihat mata saya? . Saya tidak berbicara tentang resolusi, fokus, atau detail. Saya tertarik pada eksposur atau rentang dinamis yang mirip dengan ketika kita memfokuskan mata pada satu adegan.

dynamic-range digital-vs-film human-vision-system LifeH2O
sumber

2

Saya tidak mengerti mengapa Anda mengatakan "kamera yang lebih baru seharusnya dapat menangkap rentang dinamis sebanyak ini dengan mudah". Mereka didasarkan pada teknologi yang sama sekali berbeda dari mata kami, jadi saya benar-benar tidak mengerti mengapa Anda mengharapkan mereka memiliki karakteristik yang sama.

Philip Kendall

Jadi apakah semua rentang dinamis yang menciptakan sebagian besar masalah?

LifeH2O

Saya sedang memikirkan eksperimen, membuat adegan di atas kertas dengan lensa dan kemudian menangkapnya dengan kamera. Ini harus menormalkan rentang dinamis.

LifeH2O

4

Kunjungi jvsc.jst.go.jp/find/mindlab/english/index.html untuk melihat secara interaktif bagaimana Anda dibodohi oleh otak;)

Stormenet

1

@Stormenet: Itu adalah tautan yang luar biasa!

Chinmay Kanchi

45

Alasan Anda dapat melihat rentang dinamis yang begitu besar bukanlah karena mata, sebagai perangkat optik, dapat benar-benar menangkap rentang tersebut - alasannya adalah bahwa otak Anda dapat menggabungkan informasi dari banyak dan banyak "paparan" dari mata dan buat panorama HDR adegan di depan Anda.

Mata sangat buruk dari sudut pandang kualitas gambar tetapi memiliki "frame rate" yang sangat tinggi dan dapat mengubah sensitivitas, arah, dan fokus dengan sangat cepat.

Otak mengambil semua gambar dari mata dan membuat gambar yang menurut Anda Anda lihat - ini termasuk detail dari gambar dengan sensitivitas yang berbeda dan bahkan detail yang seluruhnya dibuat berdasarkan apa yang Anda harapkan. (Ini adalah salah satu alasan mengapa ada ilusi optik - otak dapat tertipu untuk "melihat" hal-hal yang tidak benar-benar ada).

Jadi, Anda dapat melihat dengan kamera Anda seperti halnya dengan mata Anda, hanya mengambil banyak pajanan pada pengaturan yang berbeda kemudian memuat semuanya ke dalam Photoshop, membuat panorama HDR dan menggunakan "isi konten sadar" untuk mengisi celah.

Ngomong-ngomong, mengapa kamera "harus" dapat menangkap rentang itu tetapi monitor seharusnya tidak dapat mereproduksinya? Jika teknologi yang tidak ada harus ada maka monitor harus dapat mereproduksi apa pun yang bisa kita lihat (dan saya harus bisa berlibur di hotel gravitasi rendah di bulan)

Nir
sumber

1

Anda mengalahkan saya sekitar 4 menit dengan jawaban yang hampir sama!

Matt Grum

22

Anda mungkin memiliki sedikit keuntungan di sensor dynamic range lebih kamera, tetapi sebagian besar dari apa yang membuat perbedaan adalah memiliki sistem yang canggih autoexposure, saccades , pengolahan HDR, dan sistem pengenalan adegan yang tetap berlangsung di beberapa eksposur . Otak manusia setidaknya sama pentingnya dengan sistem visual seperti halnya mata .

Disajikan dengan pemandangan yang memiliki jangkauan dinamis sangat tinggi, sistem visual manusia membutuhkan waktu untuk beradaptasi. Itu bukan karena kita harus menyesuaikan pengaturan rentang dinamis, tetapi karena kita perlu menganalisis bagian pemandangan yang sangat terang dan sangat gelap secara terpisah, lalu tempelkan bagian-bagian penting gambar bersama-sama. Banyak sekali dari apa yang kita "lihat" sebenarnya tergantung pada sudah mengetahui apa yang ada di sana; kita dapat menggunakan sedikit indikasi detail nyata untuk mengisi bagian yang kosong (dan ketika kita tidak memiliki informasi nyata yang cukup, kita dapat melakukan interpolasi - tetapi tidak selalu dengan benar ).

Mendapatkan kamera - kamera apa saja - untuk beroperasi pada level itu berarti merancang sistem yang "tahu" apa yang dilihatnya. Kita sudah dapat melakukan versi "bodoh" yang menggunakan berbagai teknik HDR (dalam contoh spesifik Anda, biasanya dengan penyembunyian sederhana di mana pintu keluar dari paparan kegelapan dan versi dari paparan terang yang dimasukkan di tempatnya). Proses otomatis saat ini didasarkan sepenuhnya pada kecerahan (karena mereka tidak dapat menganalisis makna atau kepentingan), dan cenderung menghasilkan artefak yang jelas. Dan jika Anda pernah melihat gambar gabungan HDR 32-bit mentah yang belum dipetakan (yang pada dasarnya adalah jenis hal yang hanya akan Anda dapatkan dengan meningkatkan rentang dinamis sensor), Anda mungkin akan memperhatikan bahwa gambar sangat "datar" dan kurang kontras lokal dan global. Mengetahui adegan apa yang memungkinkan kita melakukan pemetaan, untuk memutuskan di mana kontras itu penting secara lokal. Sampai kamera dapat membuat keputusan yang sama, itu tidak akan dapat menghasilkan gambar yang mirip dengan apa yang dilihat otak Anda.

Komunitas
sumber

9

Ini berkaitan dengan cara otak menginterpretasikan informasi yang diberikan oleh mata (atau dengan kata lain, itu adalah perangkat lunak bukan perangkat keras).

Kami hanya melihat warna dan detail dalam bidang yang sangat sempit di tengah visi kami. Untuk membangun gambar penuh warna yang kita rasakan, otak menggerakkan titik sentral ini tanpa kita sadari.

Saya bukan ahli neurobiologis tetapi cukup beralasan bahwa ketika otak membuat gambar yang lebih luas dari banyak foto kecil ini, ia juga melakukan normalisasi pada kecerahan yang menghasilkan gambar yang muncul dengan kecerahan yang kurang lebih sama di mana-mana, meskipun ada beberapa area yang jauh lebih terang dalam kenyataan. Pada dasarnya kemampuan untuk melihat hal-hal yang gelap dan terang pada saat yang sama adalah ilusi.

Tidak ada alasan perilaku ini tidak dapat ditiru oleh kamera digital, juga tidak ada alasan kami tidak dapat membuat sensor yang mampu memiliki jangkauan dinamis yang jauh lebih besar dalam satu eksposur. Bahkan Fuji membuat sensor dengan photosites sensitivitas ekstra rendah untuk menangkap detail sorotan ekstra.

Masalahnya adalah ketidakmampuan untuk menampilkan gambar rentang dinamis tinggi. Untuk menampilkan gambar seperti itu pada monitor rentang dinamis rendah standar, Anda perlu melakukan beberapa pemrosesan khusus yang disebut tonemapping, yang memiliki kelemahannya sendiri. Bagi kebanyakan konsumen kamera dengan rentang dinamis tinggi akan lebih merepotkan.

Matt Grum
sumber

3

Ringkasan:

Tuhan membuat mata kita.
Kami membuat kamera.
Kami belum menyusul Tuhan.
TETAPI kamera terbaik yang tersedia kira-kira memenuhi persyaratan yang Anda jelaskan.
Ada cara untuk mencapai apa yang Anda inginkan. Anda hanya memutuskan untuk mendefinisikannya bukan apa yang Anda inginkan. Itu pilihanmu.

Tingkat cahaya di ruang yang gelap dengan jendela yang terbuka ke pemandangan luar mungkin serendah sekitar 0,1 lux (0,1 lumen per meter persegi.) Tingkat cahaya pemandangan luar bisa berkisar antara 10 hingga ribuan lux dalam situasi yang Anda gambarkan.

Pada 100 lux eksternal dan internal 0,1 lux rasionya adalah 1000: 1 atau hanya di bawah 10 bit rentang dinamis. Banyak kamera modern dapat membedakan perbedaan nada pada kedua ujung kisaran ini yang diatur dengan benar. Jika tingkat cahaya pohon hanya menjenuhkan sensor maka Anda akan memiliki sekitar 4 bit level yang tersedia di dalam ruangan = 16 level pencahayaan. jadi kamu bisa melihat beberapa tingkat detail dengan tingkat paling terang KECUALI BAHWA tingkat cahaya yang begitu rendah sehingga mata akan kesulitan dengannya.

Jika tingkat cahaya pohon 1000 lux (= 1% dari sinar matahari penuh), Anda akan membutuhkan sekitar 13 bit rentang dinamis. Kamera full frame 35mm terbaik yang tersedia akan menangani ini. Penyesuaian kamera harus tepat dan Anda akan memiliki sekitar nol informasi nada di dalam ruangan. Tingkat pencahayaan eksternal ini lebih tinggi daripada yang Anda dapatkan selain dari situasi waktu malam yang terang.

Banyak DSLR modern menengah ke atas memiliki pemrosesan HDR inbuilt yang memungkinkan rentang dinamis yang jauh lebih besar diperoleh dengan menggabungkan beberapa gambar. Bahkan foto HDR 2 gambar akan dengan mudah mengakomodasi pemandangan Anda. Sony A77 saya menawarkan hingga +/- 6 EV 3 frame HDR. Itu akan memberikan lebih dari 20 bit rentang dinamis - memungkinkan variasi nada yang sangat memadai di ujung atas dan bawah dalam contoh Anda.

Russell McMahon
sumber

11

Sebagai alternatif, dapat dikatakan bahwa evolusi memiliki kemajuan awal selama lima ratus juta tahun pada para insinyur kami, dan tidak masuk akal untuk mengharapkan kami mengejar ketinggalannya dalam waktu dekat ini :)

Staale S

4

Itu sentuhan teologis ...

Rowland Shaw

2

Saya tidak berpikir ini menjawab pertanyaan - itu hanya mengatakan "karena mata lebih baik". Baik. Bagaimana mereka mencapai itu?

mattdm

1

@ naught101 - "tertangkap" adalah ukuran yang agak bernuansa :-). Mata sendiri agak lebih rendah dalam sejumlah cara untuk mencapai yang terbaik yang bisa kita lakukan. Tetapi masih mengelola beberapa prestasi luar biasa. misal mata yang diadaptasi gelap dapat mendeteksi satu foton! Tetapi, yang membuat hidup sangat sulit bagi para penipu adalah bahwa mata hanya merupakan bagian dari sistem multi-organ yang terintegrasi - dan sejauh ini otak masih bisa berdetak.

Russell McMahon

1

@RowlandShaw - hanya jika Anda menginginkannya seperti itu. Yang lain menawarkan terjemahan yang sesuai dengan pandangan dunia mereka sendiri. Pernyataan seperti itu bisa menjadi metafora untuk apa pun yang Anda inginkan (Cthulu, FSM, Ever-looshin, ...) atau tidak.

Russell McMahon

2

Apakah hanya masalah kamera digital atau sama dengan kamera film?

Tidak ada jawaban yang menyentuh ini, paling tidak secara langsung ... ya, itu juga merupakan masalah dengan film. Film transparansi warna Fuji Velvia yang terkenal, misalnya, memiliki rentang dinamis yang benar-benar busuk (warna yang hebat!) Film transparansi pada umumnya menderita karenanya. Di sisi lain, film negatif dapat memiliki rentang dinamis yang sangat baik, kira-kira sebagus kamera digital terbaik saat ini. Meskipun ditangani dengan sedikit berbeda - meskipun digital memiliki respons linier terhadap cahaya, film cenderung memiliki kurva kontras "S" yang bertanda. Hitam dan hampir-hitam, dan putih dan hampir-putih, dikelompokkan lebih dari nada tengah.

Ingatlah bahwa karena foto film pada umumnya akan dicetak dengan tinta pada latar belakang kertas putih, ada batasan yang tidak terlalu murah hati tentang seberapa banyak rentang dinamis yang ingin ia tangkap di tempat pertama! Menangkap, katakanlah, rentang dinamis tiga puluh stop dan kemudian mengeluarkannya ke ... apa DR ballpark dari cetakan foto? Lima berhenti? Enam? ... media keluaran akan terlihat ... aneh, untuk sedikitnya. Saya menduga bahwa faktor inilah yang melebihi rintangan yang tidak dapat diimbangi dengan kimia yang membatasi rentang dinamis film fotografi. Bukan karena kita tidak bisa melakukannya, itu lebih karena kita secara aktif tidak ingin melakukannya.

Staale S
sumber

2

Hal-hal yang cukup untuk mengisi buku - tetapi intinya adalah bahwa mata manusia melihat kecerahan secara logis sementara kamera "melihat" kecerahan secara linear.

Jadi jika Anda mengasumsikan suatu kondisi di mana kecerahan berubah dari 1 menjadi 10.000 (angka yang dipilih secara acak), dalam log basis 10, mata manusia akan melihat kecerahan sebagai 0 hingga 5 sedangkan kamera, secara linier, melihatnya sebagai 1 hingga 10.000. sebuah sensor yang dapat mencakup kisaran besar seperti itu sulit karena Anda memiliki noise yang mengganggu pengukuran rendah dan overspill mengganggu pengukuran kecerahan yang lebih tinggi. Karena itu, saya percaya ada kamera MERAH yang dapat merekam 18 stop rentang dinamis - tidak yakin apakah itu hanya prototipe atau model produksi sekalipun.

Omong-omong perbedaan logaritmik dan linier juga mengapa kecerahan berlipat dua atau separuh per perbedaan satu atap.

Tapi ini sudah cukup untuk topik penelitian - jadi ini hanyalah petunjuk singkat.

DetlevCM
sumber

Efek logaritmik ini di mata manusia meratakan rentang dinamis dan otak mengatasinya karena ia hanya mendapatkan seperti itu selama hidupnya. Jika kamera juga meratakan kisaran dinamis, maka ketika Anda melihat hasilnya, Anda akan mendapatkan perataan ganda, dan otak Anda hanya terbiasa dengan perataan tunggal. Jika Anda melihat dunia dengan perangkat yang melakukan ini, dan Anda melanjutkan tampilan selama berhari-hari, Anda akan terbiasa dengannya seperti biasa. Lepaskan perangkat setelah itu dan dunia akan terlihat keras dan terlalu kontras.

Skaperen

@ Skaperen Saya tidak berpikir saya akan selalu memanggil logaritma meratakan rentang dinamis. Jika Anda skala kecerahan logaritmik dan linier dalam perbandingan berdampingan, logaritma yang mungkin tampak lebih datar, TAPI pertanyaannya adalah berapa banyak tempat desimal yang kita lihat? Secara teknis kedua gambar masih akan berisi informasi yang sama hanya pada skala yang berbeda - dan penskalaan tidak mengubah informasi yang terkandung selama Anda tidak mengalami kesalahan pembulatan.

DetlevCM

2

Mata tidak menangkap rentang dinamis. Ini kompres rentang dinamis, dan kemudian "pemrosesan pos" di otak menciptakan ilusi rentang dinamis. Rentang dinamis terkompresi adalah mengapa Anda dapat melihat ke dalam bayangan dan area yang menyala secara bersamaan. "Keuntungan", bisa dikatakan, secara otomatis berputar di bagian retina yang merasakan bayangan, membuatnya lebih cerah, dan berkurang ketika retina melihat area yang menyala. Otak masih tahu bahwa itu melihat ke dalam bayangan sehingga menciptakan sensasi bahwa di sana gelap. Semacam ekspansi atas data terkompresi sedang berlangsung, sehingga untuk berbicara, sehingga Anda tidak menyadari bahwa rentang dinamis telah dikompresi.

Sensor pada kamera digital dapat dengan mudah mengungguli retina dalam rentang dinamis yang mentah. Masalahnya adalah Anda tidak mengontrol eksposur berdasarkan per area. Kamera memiliki pengaturan penguatan (biasanya disajikan dalam terminologi film sebagai pengaturan ISO) yang bersifat global.

Apa yang dilakukan mata, bisa dikatakan, adalah seperti menggunakan "ISO 100" untuk area terang dan "ISO 800" untuk area gelap pada saat bersamaan.

Jika kamera dapat menyesuaikan penguatan untuk area piksel tertentu berdasarkan kecerahan, itu pasti akan berguna, tetapi kita tahu dari menerapkan efek levelling gain seperti itu di pasca pemrosesan sehingga otak tidak benar-benar tertipu olehnya. Itu tidak terlihat alami. Itu terlihat alami hanya ketika mata Anda melakukannya berkoordinasi dengan otak Anda sendiri.

Segera
sumber

2

Ini adalah semacam pertanyaan yang menarik jika Anda memberinya kesempatan alih-alih mengemukakan alasan yang jelas mengapa kamera sudah dibuat seperti itu.

Mari kita pertimbangkan opsi terdekat. Pemetaan Nada adalah metode di mana filter low-pass diterapkan pada nilai eksponen dari gambar RGBe. Itu memainkan peran besar dalam bagaimana mata melihat sesuatu. Tapi mari kita pertimbangkan bahwa mata kita mengambil bayangan panjang. Mereka bekerja jauh lebih seperti kamera video daripada kamera foto.

Pemetaan nada dapat sangat ditingkatkan jika dibangun seperti shader GLSL yang berjalan secara real-time dengan kamera video khusus yang dapat menangkap aliran gambar HDR yang konstan.

Dalam contoh yang jauh lebih sederhana, foto "HDR" iPhone adalah gabungan dari gambar dengan eksposur rendah dan tinggi yang didorong melalui proses pemetaan nada yang bekerja cukup baik jika Anda belum mencobanya. Banyak kamera kelas konsumen lainnya melakukan hal serupa.

Ada juga subjek yang menarik tentang bagaimana intuisi / niat / kebebasan-akan memainkan bagaimana mata Anda sedang dikalibrasi sepanjang aliran waktu. Jika Anda melihat dinding yang gelap dan berpikir untuk memalingkan kepala ke jendela yang terang, otak Anda dapat memberitahu mata Anda untuk terus maju dan mulai menutup murid-murid Anda. Kamera dengan eksposur otomatis dapat melakukan hal yang sama tetapi hanya setelah ada terlalu banyak cahaya yang masuk. Orang yang bekerja di bioskop menghabiskan banyak waktu agar pengaturan pengaturan kamera film mengalir dengan lancar sehingga mereka merasa alami dalam bidikan yang rumit (atau menerangi pemandangan sedemikian rupa sehingga pengaturan kamera tidak benar-benar harus disesuaikan) Tapi sekali lagi, satu-satunya alasan hal-hal seperti itu bekerja adalah karena sutradara tahu apa yang akan terjadi pada kamera sebelum terjadi.

Bowling Wray
sumber

0

Masalah terbesar adalah mereproduksi gambar yang diambil.

Bukan di luar ranah teknologi untuk membuat sensor gambar dan konfigurasi yang akan menangkap rentang tingkat kecerahan yang sangat luas dalam satu gambar. Pada akhirnya itu hanya soal penghitungan foton, yang merupakan teknologi yang melakukan skala ke tingkat yang diperlukan. Kamera saat ini terutama menggunakan pengaturan pencahayaan untuk memodulasi jumlah kecerahan yang dilihat sensor, meskipun lebih banyak pekerjaan ini dapat dilakukan dalam sensor, mungkin menghasilkan noise kesalahan yang lebih besar, tetapi Anda tentu bisa mendapatkan jangkauan yang lebih luas dari sensor foto daripada apa yang saat ini tersedia di pasar.

Tetapi masalahnya adalah ini: begitu Anda memiliki gambar itu, apa yang Anda lakukan dengannya? Bahkan tampilan kelas atas masih menggunakan warna 24-bit, yang berarti hanya 256 warna per saluran warna diperbolehkan. Printer saat ini juga terbatas, jika tidak lebih. Jadi tidak ada yang bisa dilakukan dengan gambar seperti itu tanpa proses terlebih dahulu untuk mengurangi rentang ke apa yang diproduksi kamera.

Anda mungkin pernah melihat masalah ini sebelumnya: sebagian besar format RAW saat ini sudah menyimpan rentang yang lebih luas daripada yang dapat direproduksi, dan rentang warna harus dikompres atau dipotong sebelum Anda dapat melihat gambar. Menambahkan rentang yang lebih banyak ke output RAW akan lebih sama. Kamera kemungkinan akan secara dramatis lebih mahal tetapi gambar tidak akan secara signifikan lebih baik karena Anda masih harus memotong kisaran ke warna 24-bit sebelum Anda dapat melihatnya.

Namun, mungkin dengan perangkat lunak yang tepat dan jenis pengguna yang tepat, Anda mungkin bisa mendapatkan sesuatu yang luar biasa darinya. Mungkin tidak jauh berbeda dengan fotografi HDR saat ini, tetapi Anda tidak harus mengambil banyak gambar.

tylerl
sumber

2

Bukan bit per warna yang menjadi masalah - yang menentukan jumlah rona berbeda, tetapi tidak mengatakan apa-apa tentang rentang keseluruhan.

mattdm

@mattdm benar; tetapi rentang keseluruhan adalah fungsi perangkat output yang tidak tergantung pada data gambar itu sendiri. Rasio kecerahan dan kontras pada layar saya adalah fungsi dari, dan hanya diketahui oleh layar saya dan tidak dipengaruhi oleh kamera yang saya gunakan untuk mengambil gambar. Jadi sekali lagi, perangkat output adalah faktor pembatas, bukan kamera. Namun, bit per warna tidak mempengaruhi rentang dalam arti bahwa meningkatkan jangkauan Anda tanpa meningkatkan jumlah tingkat dalam rentang hanya memberi Anda gambaran yang lebih terang / gelap tanpa memungkinkan Anda untuk melihat apa-apa lagi di dalamnya.

tylerl

Mengapa kamera tidak menangkap jangkauan dinamis seperti mata kita?

Jawaban: