Terima kasih atas semua jawabannya, semuanya. Dengan bantuan Anda, saya dapat menyusun daftar perintah yang dapat mengekstrak jumlah halaman dari hampir semua dokumen kantor yang relevan:
DOCX / PPTX
unzip -p 'sample.docx' docProps/app.xml | grep -oP '(?<=\<Pages\>).*(?=\</Pages\>)'
unzip -p 'sample.pptx' docProps/app.xml | grep -oP '(?<=\<Slides\>).*(?=\</Slides\>)'
Catatan : unzip
dapat diinstal dengan sudo apt-get install unzip
.
DOC / PPT
wvSummary sample.doc | grep -oP '(?<=of Pages = )[ A-Za-z0-9]*'
wvSummary sample.ppt | grep -oP '(?<=of Slides = )[ A-Za-z0-9]*'
Catatan : wvSummary
(case-sensitive!) Adalah bagian dari wv
paket. Instal dengan sudo apt-get install wv
.
ODT
unzip -p sample.odt meta.xml | grep -oP '(?<=page-count=")[ A-Za-z0-9]*'
PDF
pdfinfo sample.pdf | grep -oP '(?<=Pages: )[ A-Za-z0-9]*'
Catatan: pdfinfo
adalah bagian dari poppler-utils
dan harus diinstal sebelumnya di Ubuntu.
DJVU
djvused -e "n" sample.djvu
Catatan: djvused
adalah bagian dari djvulibre-bin
paket dan dapat diinstal bersama sudo apt-get install djvulibre-bin
.
Saya tidak menemukan cara untuk mengekstrak
odt
info file sepertipdfinfo
halnya, tetapi Anda dapat membuat skrip cepat untuk digunakanpdfinfo
denganodt
file, mengkonversi setiap file odt ke PDF dan kemudian menghapus file yang dikonversi jika Anda tidak akan menggunakannya:Semoga ini bisa membantu Anda.
sumber