Bagaimana data dalam PDF ini dapat diperoleh dalam bentuk teks biasa?

1

Di file ini mulai dari halaman 5, sejumlah baris data ditulis. Saya perlu baris ini dalam format teks biasa. Bagaimana saya bisa mengekstraknya?

TMOTTM
sumber

Jawaban:

2

Anda dapat mengonversi konten PDF menjadi teks biasa pdftotext .

Lari saja pdftotext Appendix.pdf dan itu akan memuntahkan Appendix.txt akan semua teks polos di dalamnya.

Der Hochstapler
sumber
pdftotext berfungsi, menggunakan opsi -raw
TMOTTM
4

Apa yang salah dengan menyalinnya saja?

Cartesian coordinates for all structures:

React

6 6.390727 0.132095 4.960391
6 5.969971 -1.321389 4.932512
8 6.229932 -2.095504 5.854485
7 5.288242 -1.652799 3.816634
6 4.675691 -2.942048 3.614359
6 3.234362 -2.800745 3.119131
6 3.107771 -2.046443 1.784738
8 3.907686 -1.094593 1.556228
8 2.188216 -2.443833 1.008985
6 -5.322697 -1.975980 -1.333635
6 -4.229638 -1.620947 -0.307343
16 -2.533574 -1.760488 -0.994608
6 8.431743 -0.064459 -3.050202
6 7.281182 -0.571938 -2.237196
6 7.017856 -0.342487 -0.904258
6 6.208644 -1.400670 -2.720284
7 5.852218 -0.976787 -0.527814
Karan
sumber
Saya seharusnya menulis bahwa saya tentu saja mencoba menyalin teks, yang akhirnya mengacaukan kolom.
TMOTTM
"Mengacaukan" bagaimana tepatnya? Seperti yang Anda lihat di atas, mereka tampak baik-baik saja bagi saya.
Karan
pemirsa apa yang Anda gunakan dari mana Anda menyalin karakter? Di Pratinjau di Mac OS X, menggunakan hasil seret-salin-tempel di kolom dan struktur baris tidak dipertahankan. Sebagai gantinya, karakter dari dua baris atau lebih akan muncul pada satu baris.
TMOTTM
Saya menggunakan Sumatra, tetapi mereka tampaknya tidak memiliki versi untuk OS X.
Karan
0
  1. Simpan dokumen ke mesin lokal.

  2. http://www.pdfonline.com/pdf-to-word-converter/ akan mengonversi pdf ke Word. Dokumen yang lebih besar hanya dapat dikonversi sebagian, jadi Anda mungkin harus mengonversinya dalam blok.

  3. Di Word '07, File - & gt; Opsi - & gt; Lanjut - & gt; "Menempel di dalam dokumen" dan "menempel di antara dokumen," diatur ke "hanya menyimpan teks."

  4. Potong / rekatkan data dalam satu dokumen ke dalam dirinya sendiri, potong / rekatkan dari dokumen lain ke dalam dokumen pertama.

Setelah ini, Anda harus memiliki 1 dokumen kata besar dalam teks biasa.

Brian Daniels
sumber