Apakah ada yang namanya mesin pengindeksan teks lengkap, yang dapat ditanyakan dari baris perintah dan idealnya tidak perlu menggunakan gui sama sekali?
Saya terutama tertarik untuk mengindeks ebooks dan makalah saya, jadi itu campuran pdf, epub dan beberapa djvu. (Buka) Dokumen kantor akan menyenangkan, tetapi jauh lebih rendah dalam daftar saya.
command-line
search
Julien
sumber
sumber
Jawaban:
Pernahkah Anda melihat Lucene atau Sphinx? Meskipun pada awalnya Anda perlu mem-parsing dokumen yang ingin Anda indeks, setelah itu selesai, salah satunya dapat mencari dari cli.
Untuk Lucene, ada beberapa info untuk melakukan ini tersedia .
Sphinx, sedikit lebih kabur, tetapi ada juga beberapa dokumentasi yang tersedia . Anda dapat meneruskan data XML terstruktur pilihan Anda ke sphinx melalui sumber data xmlpipe2.
Lucene mengandalkan Java, sementara Sphinx dibangun di C ++ tanpa ketergantungan luar yang diperlukan.
Salah satu akan memerlukan sedikit kerja untuk melakukan apa yang Anda inginkan, tetapi, sepertinya solusi yang benar-benar bisa diterapkan.
sumber
periksa xapian . Ini memiliki antarmuka baris perintah dan dapat mengindeks banyak format.
sumber
Recoll dapat dibangun tanpa GUI dan akan mencari jenis dokumen Anda dari baris perintah.
Ini menggunakan Xapian di bawah tenda.
sumber
Pelacak dapat dipanggil dari baris perintah dan gtk + bukan ketergantungan sulit untuk proyek (tetapi mungkin untuk paket).
sumber
Jawaban ini merekomendasikan menggunakan pencarian kode Google ,
Pengguna super di Debian / derivatif dapat mencoba:
sudo apt-get install codesearch
sumber
Saat ini ada dua aliran Tracker, stabil (0,8) dan tidak stabil (0,9). OS Anda kemungkinan memiliki versi 0.8, jadi jika Anda mampu membelinya (memiliki beberapa ketergantungan perangkat lunak tepi ), ambil tarfile terbaru (0.9.x). Ini memiliki banyak perbaikan lebih dari 0,8, dan saat ini sedang distabilkan lebih lanjut menjadi 0,10 (angka genap mewakili stabilitas). Jika Anda memilih untuk menempuh rute ini, gunakan perintah ini untuk mengonfigurasi:
Anda mungkin tidak akan menginstal dependensi, jadi sebaiknya Anda menginstal 0,8 dari distro Anda, dan hindari bit-bit GUI. Pada Debian Squeeze, Ubuntu 10.10, dan Ubuntu 11.04, ini terpecah dengan baik. Jadi ( sebagai root ) jalankan:
Alat CLI untuk ini adalah
tracker-search
, jadi jalankan dengan--help
opsi untuk melihat bagaimana memanfaatkannya :-)catatan :
tracker-applet
dantracker-preferences
. Namun mereka memiliki paket terpisah untuktracker-search-tool
, antarmuka pencarian GUI.sumber
Saya bekerja untuk menulis alat pencarian teks lengkap (baru) untuk mengindeks dan mencari halaman manual untuk NetBSD musim panas ini menggunakan Sqlite3. Ini terdiri dari dua alat baris perintah:
Anda dapat dengan mudah menulis alat serupa untuk diri sendiri, untuk pdf, Anda akan memerlukan perpustakaan untuk mem-parsing dokumen pdf dan juga utilitas untuk mengurai dokumen kantor terbuka.
Anda dapat membaca lebih lanjut tentang proyek di sini
Kodenya ada di sini
sumber