Pengaturan kamera terbaik untuk memotret teks?

11

Saya menggunakan S95 untuk memotret dokumen teks (baik kertas & mikrofilm) untuk OCR. Saya sudah bertanya tentang masalah bagaimana cara terbaik memotret layar komputer untuk mikrofilm, tapi saya sudah memikirkan cara terbaik untuk memotret teks sehingga teks keluar jelas dan jernih. Inilah pemikiran saya saat ini, tetapi saya ingin mendengar apa yang orang lain katakan memiliki pengalaman fotografi lebih banyak daripada saya:

  1. Saya menggunakan # megapixel yang lebih kecil (sekitar 6-7MP daripada maksimum S95, yaitu 10MP), sehingga file PDF yang dihasilkan tidak membunuh komputer saya ketika saya benar-benar pergi untuk menggulirnya

  2. Bukaan - lebih rendah (mis. F / 6.3), sehingga jika kamera tidak sejajar dengan halaman, teks akan tetap dalam fokus

  3. Kecepatan rana - Ada tradeoff di sini, karena perpustakaan umumnya memiliki cahaya yang lebih rendah, jadi saya ingin menurunkan kecepatan rana untuk meningkatkan eksposur, tetapi tanpa tripod, ada kemungkinan goyangan kamera

  4. ISO - Saya tidak begitu yakin bagaimana ini akan mempengaruhi itu.

  5. White Balance - Sekali lagi, tidak terlalu yakin.

Saya telah bereksperimen dengan pengaturan berbeda pada kamera saya, tetapi saya hanya belajar tentang fotografi dan ingin tahu apakah ada yang punya saran untuk cara terbaik memotret teks, dari buku atau dari dokumen, yang mudah dibaca.

Jason
sumber
3
Mengapa tidak menggunakan alat yang tepat untuk pekerjaan itu dan menggunakan pemindai?
ahockley
7
"Mengapa tidak menggunakan alat yang tepat untuk pekerjaan itu dan menggunakan pemindai?" - Karena banyak dokumen yang saya kerjakan tidak dapat dipindai. Mereka sangat rapuh, atau perpustakaan tidak memungkinkan Anda untuk memindai, atau perpustakaan membebankan biaya terlalu tinggi untuk memindai hingga $ 0,50 / halaman.
Jason
2
Saya ingin itu dikatakan: Saya harap penggunaan Anda menghormati hak cipta secara tepat, jika dan relevan. :) Mengira begitu, saya harap Anda menemukan jawaban Anda!
lindes
3
"Saya harap penggunaan Anda menghormati hak cipta secara tepat" - Ya, pekerjaan saya adalah dengan dokumen di luar pembatasan hak cipta (saya adalah seorang sejarawan, kebanyakan mempelajari Eropa akhir abad ke-19)
Jason
2
@ahockley: alasan lain untuk tidak memindai adalah karena ini membutuhkan waktu yang sangat lama. Dengan DSLR saya dapat melakukan sekitar 20 halaman per menit di atas meja, tetapi pemindai yang cepat menggunakan pengumpan dokumen dan biaya banyak.

Jawaban:

7

Jika kamera Anda memiliki mode hitam putih, saya akan mencobanya untuk mengurangi waktu pemrosesan posting Anda. Selain itu, banyak program OCR yang telah saya kerjakan bekerja jauh lebih baik di B&W.

Anda akan ingin mendapatkan sejajar dengan halaman yang Anda bisa, karena untuk mengurangi guncangan kamera saat memegang, Anda mungkin akan memerlukan aperture terluas untuk memaksimalkan kecepatan rana Anda. Sensor kecil pada s95 Anda akan meningkatkan DOF Anda cukup sehingga saya akan membuka aperture selebar yang Anda bisa lolos.

Mengingat Anda hanya akan menjalankan ini melalui OCR, engkol ISO Anda hingga apa pun yang memberi Anda paparan yang tepat dengan goyang minimal. OCR jauh lebih kecil kemungkinannya untuk mengeluh tentang kebisingan tambahan daripada surat buram.

Keseimbangan putih, jika Anda hanya berbicara tentang teks, harus sesuai dengan pengaturan "dalam ruangan" untuk kamera Anda - tapi terus terang, jangan terlalu khawatir tentang hal itu.

Megapiksel Anda mungkin hanya masalah jika teks dokumen Anda sangat kecil dan Anda harus menyelesaikan dengan jelas tingkat detail, tapi saya kira 6-7 akan baik-baik saja untuk sebagian besar hal.

rfusca
sumber
1
Anda mungkin berarti "tegak lurus dengan halaman". Jika Anda paralel, akan sulit untuk membaca teks. ;-)
Craig Walker
@Craig Walker - dia menggunakan istilah "paralel" ke halaman dan saya mengerti apa yang dia maksud, jadi saya tidak mencoba membingungkannya. Belum lagi sensor itu sendiri akan paralel, seperti halnya jendela bidik. Itu hanya tergantung pada bagian mana dari kamera referensi Anda. Istilah itu disengaja.
rfusca
Gunakan megapixel sebanyak yang Anda bisa, dokumen OCR adalah yang penting dan mereka akan relatif kecil dan selama sumbernya semua teks, tetap tidak terpengaruh oleh resolusi kamera. Saya menggunakan Abbyy FineReader dan berfungsi lebih baik pada gambar dengan resolusi lebih tinggi (21MP daripada 10MP, misalnya). Jadi potret pada 10MP.
cukup adil.
Craig Walker
+1 untuk mode B / W. RGB untuk pemrosesan teks membuang-buang piksel.
Greg
2

Anda tampaknya sudah memahami pengaturan dengan baik. Goyangan kamera akan merusak keterbacaan teks lebih dari apa pun, jadi saya akan mengoptimalkannya terlebih dahulu. Jika Anda tidak dapat menggunakan tripod, pastikan kecepatan rana Anda setidaknya 1 melebihi panjang fokus Anda (setara 35mm). Perkecil tampilan akan membuat ini lebih mudah. Gunakan stabilisasi gambar jika Anda memilikinya.

Bukaan dapat diatur cukup lebar, pastikan Anda sejajar dengan halaman. Bukaan lebar akan membantu dengan kecepatan rana, sekali lagi kabur karena bukaan lebar tidak ada artinya dibandingkan dengan kabur karena gerakan kamera!

ISO, apa pun yang Anda butuhkan untuk mendapatkan eksposur yang baik. Kebisingan seharusnya tidak memengaruhi keterbacaan sampai menjadi sangat buruk.

Mengambil foto white balance khusus berdasarkan pada kertas itu sendiri akan lebih disukai, tetapi perangkat lunak OCR harus mampu mengatasi latar belakang putih.

Matt Grum
sumber
1
  1. Saya menganggap Anda mengonversi JPEG ke PDF. Saya sarankan menangkap maksimum, dan menggunakan program untuk berhemat ke 6-7 MP dengan penajaman diterapkan setelah berhemat dan sebelum konversi ke PDF.

  2. Untuk memperjelas, Anda ingin aperture yang lebih sempit untuk kedalaman bidang yang lebih luas, yang merupakan angka f-stop yang lebih tinggi. (mis. Anda menginginkan f / 8 bukannya f / 2). Dengan teks agar mudah dibaca, usahakan agar kamera diarahkan setepat mungkin sehingga Anda tidak perlu khawatir tentang kedalaman bidang. Sebaiknya berhenti sedikit dari terbuka lebar untuk mengurangi aberasi seperti CA yang akan Anda lihat dengan teks hitam putih. Semakin dekat Anda dengan kertas, semakin dangkal kedalaman bidang akan.

  3. Ini mungkin akan memiliki efek terbesar pada keterbacaan jika Anda berpegangan tangan. Jika berpegangan tangan, Anda ingin memilih kecepatan rana sedemikian sehingga lebih cepat dari 1 / (panjang fokus setara 35mm), atau bahkan lebih cepat. Ini tergantung pada pengaturan zoom apa yang Anda gunakan pada P&S Anda. Jika Anda menggunakan ujung yang lebar, Anda bisa pergi dengan kecepatan rana yang lebih lama, tetapi mungkin mendapatkan distorsi barel. Jika Anda memotret dokumen teks dan bukan layar komputer, saya sarankan mencoba flash.

    Jika Anda bisa, menopang dokumen ke atas (direkam atau sesuatu yang datar) sehingga Anda dapat meletakkan kamera pada sesuatu dan mendapatkan kecepatan rana selama yang Anda inginkan. Anda juga dapat menggunakan beanbag atau benda kecil untuk memiringkan kamera saat diletakkan. Anda juga bisa mendapatkan adaptor tripod waterbottle untuk P&S.

  4. Bukaan, kecepatan rana, dan ISO membentuk segitiga eksposur. Baca tentang ini di sini . Semakin tinggi ISO, apertur yang lebih sempit, dan kecepatan rana yang lebih pendek dapat Anda gunakan, tetapi gambar akan lebih berisik. Saya merekomendasikan ISO rendah (400 atau kurang) untuk P&S dengan teks.

  5. Pilih keseimbangan putih untuk situasi pencahayaan Anda. Jika Anda memiliki florescent, gunakan itu. Jika Anda menggunakan flash, gunakan flash white balance.

Eruditas
sumber
Saya tidak berpikir f / 8 realistis untuk memotret di dalam ruangan genggam (kecuali menggunakan flash, Anda harus meminta izin perpustakaan terlebih dahulu) ditambah f / 8 akan menyebabkan gangguan dengan sensor kecil, gain ketajaman minimal dibandingkan dengan peningkatan waktu rana / ISO yang diperlukan.
Matt Grum
@ Mat f / 8 adalah contoh untuk menunjukkan bahwa ia menginginkan angka yang lebih tinggi untuk meningkatkan kedalaman bidang (dan mengurangi penyimpangan lainnya seperti CA, yang mungkin terlihat). Saya tidak memberinya panduan karena saya tidak yakin berapa banyak cahaya yang dimilikinya. Gangguan? Maksud Anda difraksi?
Eruditas
Ya maksud saya difraksi - Saya menulis ini di ponsel saya yang memiliki kebiasaan menjengkelkan mengoreksi kata-kata saya bahkan ketika saya mengejanya dengan benar. CA tidak akan menjadi masalah besar (dibandingkan dengan goyangan kamera), saya pikir Anda sebaiknya berhenti dari terbuka lebar, jika cahaya adalah masalah besar ...
Matt Grum
Apakah kamu tidak mencintai teknologi? Ya, saya akan mengatakan one stop dari terbuka lebar adalah pedoman yang baik dan setuju bahwa goyangan kamera akan menjadi intinya.
Eruditas
Itu saran yang sangat bagus untuk menembak dengan anggota parlemen maks, dan kemudian downsample di komputer. Saya dapat membayangkan bahwa mengasah + kontras ekstra akan menghasilkan teks yang lebih tajam, lebih mudah dibaca.
Jason
1

Saya setuju dengan saran untuk memotret dalam resolusi tertinggi yang tersedia dan berhemat dalam komputer. Juga, pilih jpeg kualitas tertinggi yang bisa Anda dapatkan dari kamera Anda, atau bahkan potret mentah jika kamera Anda mengizinkannya, dan konversikan menjadi tiff atau png. Kompresi lossy di jpeg dapat membuat artefak di sekitar batas tinta / kertas yang dapat membingungkan perangkat lunak ocr Anda.

Secara umum, yang ingin Anda lakukan adalah menggunakan pengaturan yang akan mendapatkan gambar paling tajam yang bisa Anda dapatkan. Hal-hal seperti kontras, white balance dll dapat semuanya diubah di komputer. Bahkan, meningkatkan kontras menggunakan alat level atau alat kontras / kecerahan di photoshop atau GIMP dapat banyak membantu Anda.

Juga, mengonversi ke format skala abu-abu akan secara substansial mengurangi ukuran file Anda. Dan jika Anda melakukan itu, dan meningkatkan kontras, Anda tidak benar-benar perlu khawatir tentang white balance. Anda dapat bereksperimen dengan white balance, meskipun, beberapa pengaturan dapat menghasilkan kontras yang lebih baik daripada yang lain (itu tergantung pada pencahayaan Anda).

Jika komputer Anda dapat mengatasinya, lakukan semua penyesuaian (skala abu-abu, kontras, kecerahan) sebelum Anda berhemat, dan setelah berhemat, gunakan beberapa filter penajaman ke gambar.

Jan Hlavacek
sumber
1

Beberapa pemikiran, yang belum saya perhatikan di tempat lain, untuk ditambahkan ke dalam campuran:

  • Jika Anda memotret "diperbesar" (lebih banyak telefoto ), itu akan menyebabkan Anda memotret lebih jauh dari halaman, yang kemudian akan memberi Anda gambar yang lebih konsisten sehubungan dengan ukuran teks (kata-kata di sudut akan lebih dekat dengan ukuran yang sama seperti kata-kata di tengah; dengan sudut lebar, Anda mungkin mendapatkan distorsi sehubungan dengan ini). Saya tidak yakin apa pengaturan "ideal", di sini, dan itu merupakan trade-off terhadap kecepatan rana yang diperlukan, berpotensi, hanya sesuatu untuk dipikirkan.

  • Anda akan ingin " mengekspos berlebihan " terhadap apa yang mungkin dianggap oleh kamera Anda benar secara default (kecuali jika cukup pintar untuk menebak bahwa ini adalah kertas - saya memasukkannya ke dalam tanda kutip karena Anda tidak benar-benar ingin mengeksposnya secara berlebihan) , hanya mengekspos berlebihan berdasarkan pengukuran dari halaman putih), karena nada utama (kertas itu sendiri) akan menjadi hal utama yang kamera coba untuk mengekspos, dan jika Anda mengekspos kertas sebagai abu-abu tengah, Anda akan memiliki titik awal muddier. Jika Anda "mengekspos berlebihan" dengan berhenti dan setengah hingga 2 berhenti (jangan sampai langsung memotong kliping highlight), teks harus tetap bagus dan gelap, tetapi kertasnya akan bagus dan cerah, membuat pemisahan kontras ( dan karenanya OCR) lebih mudah.

  • mencoba untuk memiliki pencahayaan yang lebih baik - jika salah satu sudut halaman jauh lebih terang atau lebih gelap daripada yang lain, ini akan membuat lebih sulit untuk memisahkan hal-hal menjadi hitam dan putih murni yang kemungkinan besar Anda inginkan untuk keperluan OCR.

  • "penyalinan" sangat ideal untuk proyek-proyek seperti ini, meskipun saya kira di luar apa yang Anda dapat dengan mudah di perpustakaan ... Namun, tergantung pada cara perpustakaan Anda dikonfigurasi, mungkin ada tempat (mungkin rak di atas meja, atau batang yang memegang pencahayaan atau serupa?) bahwa Anda dapat menempatkan penjepit super dengan kepala bola (di sini satu , tetapi penjepit super dengan ukuran "tergantung" pada kepala) "stud" dan semacam tripod kepala akan dilakukan), dan kamera Anda kemudian harus dipasang di atas meja (atau apa pun) permukaan, sehingga Anda dapat memiliki posisi yang konsisten, dan stabilitas jika Anda membutuhkan eksposur yang lebih lama. Pada dasarnya, ini sama dengan tiruan "orang miskin".

    Anda mungkin juga ingin menggunakan self-timer pendek atau jarak jauh (saya kira kamera Anda memiliki mode self-timer 2 detik, dan mungkin yang kustom yang bahkan bisa lebih pendek), untuk menghindari guncangan kamera dari menekan tombol.

Hanya itu yang saya pikirkan untuk saat ini. Semoga bermanfaat.

lindes
sumber
1

Saya memiliki pekerjaan yang sama dengan Anda foto Landman dan telah melakukannya selama bertahun-tahun. Sebagian besar orang tidak tahu apa yang mereka bicarakan, percayalah padaku !!!

  1. Kamera pada M atau manual

  2. Iso 100-200 semakin tinggi # semakin terang tetapi itu mendapatkan lebih banyak biji-bijian atau kebisingan di pic

  3. Kecepatan rana 1/100 ke 1/160 (biasanya 1/125 adalah yang terbaik, semakin rendah lebih cerah tetapi Anda mendapatkan lebih banyak penguburan atau perulangan)

  4. Bukaan atau f2.7 (mengapa Anda membutuhkan bidang visi yang dalam, itu halaman datar)

  5. Bidik dalam warna, 6 hingga 10 megapiksel, lihat melalui pengaturan white balance Anda, biasanya fluorescent 1 atau 2, matikan sebagian besar bel dan bersiul jika Anda tidak yakin mematikannya

  6. mengekspos foto pada comp menggunakan acdc

Spencer
sumber
0

Beberapa saran kecil, tapi saya pikir pengaturan Anda terlihat bagus

  1. Gunakan tripod. Ini akan menghilangkan masalah dengan guncangan kamera, dan memungkinkan Anda untuk menggunakan eksposur selama yang Anda butuhkan.

  2. Hindari cahaya yang jatuh langsung ke kertas pada sudut yang dapat memantulkan langsung ke lensa dan menyebabkan sorotan di mana Anda tidak menginginkannya. Ini biasanya berarti memastikan cahaya datang dari samping.

  3. ISO: Sebagai patokan, Anda harus berbuat salah menuju nilai yang lebih rendah, tetapi saya yakin bahwa setiap perbedaan materi akan dengan cepat menjadi jelas.

Selain itu, saya tidak dapat menemukan cara untuk memperbaiki pengaturan Anda. Sejujurnya, saya pikir Anda sudah mendapatkannya.

AJ Finch
sumber
Bisakah Anda menyarankan tripod yang baik (dan relatif murah) yang akan berguna, dan izinkan saya untuk membalikkan kamera sehingga menghadap sejajar dengan halaman yang saya potret? Saya telah melihat tripod Joby dan terlihat menjanjikan, tetapi saya pernah mendengar bahwa tripod sering bergeser saat Anda menekan tombol.
Jason
@ Jason, titik adil. Saya memiliki Joby, yang saya suka, tetapi untuk menghentikannya bergerak ketika Anda menekan tombol, cukup gunakan pelepas jarak jauh atau gunakan self-timer. Ini sebenarnya tip yang bagus untuk setiap kali Anda menggunakan kecepatan rana lambat. Berita buruknya adalah bahwa tripod apa pun yang cukup berat untuk menjadi sangat stabil tidak akan murah. Maaf soal itu! (Jika Anda mengetahuinya secara berbeda, beri tahu saya!);)
AJ Finch
0

Sepertinya Anda sudah mendapatkan sebagian besar jawaban :-P Saya hanya akan menambahkan beberapa komentar pada poin Anda:

  1. Resolusi: Anda benar, Anda tidak akan memerlukan banyak resolusi di sini, terutama jika Anda hanya akan melihat gambar di layar. Saya mungkin akan membatasi maksimal resolusi layar tipikal dua kali lipat.

  2. Bukaan: Anda benar dengan memilih bukaan yang lebih kecil untuk mendapatkan sedikit ruang gerak dalam-bidang. Namun, Anda mungkin tidak akan membutuhkan banyak. Bermain dengan kedalaman kalkulator bidang untuk panjang fokus Anda, cari DOF yang masuk akal, dan kemudian pergi dengan aperture terbesar yang Anda bisa. (Namun, pastikan Anda berhenti atau dua di bawah aperture maksimal untuk ketajaman terbaik.) Anda menginginkan aperture terbesar sehingga Anda dapat memiliki lebih banyak ruang untuk bermain dengan rana dan ISO; Lihat di bawah.

  3. Bidik: jelas Anda menginginkan ini secepat mungkin untuk mengurangi goyangan, sambil tetap mendapatkan cukup cahaya. Saya telah mendengar berbagai sumber mengklaim "kecepatan rana sama dengan panjang fokus" untuk menghindari guncangan; beberapa klaim berlipat ganda. Jadi, jika Anda menggunakan lensa 50mm, cobalah untuk menjaga kecepatan rana antara 1/50 dan 1/100. Setelah Anda memilikinya, cobalah untuk kecepatan paling lambat untuk memaksimalkan cahaya.

  4. ISO: Anda harus dapat meningkatkan ini cukup tinggi. Suara mungkin mengurangi tampilan gambar, tetapi mungkin tidak akan menurunkan terlalu mudah dibaca. Apa yang "ISO tinggi" dan "terlalu berisik" tergantung pada kamera Anda. Percobaan. Ini mungkin cara terbaik bagi Anda untuk mendapatkan pencahayaan yang benar dalam cahaya rendah, dibandingkan dengan apertur dan rana.

  5. White Balance: bagi Anda, itu seharusnya tidak terlalu penting. Jika kertas foto Anda terlihat putih, apakah itu penting? (Cerita berbeda jika Anda memotret buku dengan gambar penuh warna tentunya). Jika Anda ingin memperbaikinya dalam posting, Anda akan memiliki waktu yang relatif mudah, karena Anda memiliki banyak kertas berwarna netral untuk digunakan. Saya mungkin akan meninggalkan kamera Anda di Auto White Balance dan melupakannya.

Craig Walker
sumber