Konverter PDF ke teks [tertutup]

9

Saya mencari cara "satu-klik" untuk mengambil PDF APA PUN dan mengubahnya menjadi teks biasa. Idealnya di OSX atau Linux.

Idealnya, solusinya akan mencakup fungsionalitas OCR, tetapi tidak harus selalu.

Prioritas utama adalah memiliki sesuatu yang dapat mengambil file APAPUN TANPA konfigurasi.

kaca
sumber

Jawaban:

23

Ada xpdf yang termasuk pdftotextbiner.

Pdftotext mengubah file Portable Document Format (PDF) menjadi teks biasa.

Di Linux ada penginstal yang tersedia. Tampaknya itu juga termasuk dalam poppler-utilspaket. Pada OS X Anda bisa menginstalnya menggunakan Homebrew (instal dulu) dan kemudian gunakan

brew install homebrew/x11/xpdf

yang akan mengunduh file sumber dan mengompilasinya untuk OS X. Setelah itu, gunakan saja seperti:

pdftotext your_pdf_file.pdf

yang akan menghasilkan file teks biasa. Ada beberapa opsi juga, periksa man pdftotextuntuk lebih jelasnya.

Alternatifnya adalah poppler , di OSX:

brew install poppler

di Debian dan teman-teman

apt-get install poppler-utils
slhck
sumber
pada hari ini perintahnya adalahbrew install homebrew/x11/xpdf
Diego Vieira
1
@DiegoVieira Terima kasih. Lain kali jangan ragu untuk menyarankan suntingan!
slhck
beberapa keuntungan menggunakan poppler daripada xpdf / pdftotext?
Gonzalo Bahamondez
brew install Caskroom/cask/pdftotext
Hugo
0

Alat yang bagus untuk Windows adalah A-PDF Text Extractor

Michael S.
sumber