(Mengulang pertanyaan untuk kejelasan yang lebih baik.)
Misalkan saya punya 1000 file teks. Setiap file adalah bentuk tekstual, dengan deskripsi dan header bidang tetap, tetapi datanya berbeda. Misalnya, file 1:
The Foo Factory Date: 2015-10-02 Order Details ------------------------- Order ID: [ 1 ] Amount: [ 1 ] Order Price: [ 12.34 ] Have a nice day.
dan file 2:
The Foo Factory Date: 2016-01-11 Order Details ------------------------- Order ID: [ 7 ] Amount: [ 17 ] Order Price: [ 543.21 ] Have a nice day.
dll. Sekarang, anggaplah saya melanjutkan dan menerjemahkan deskripsi lapangan ke dalam bahasa Prancis; dan saya menghapus nilai. Jadi sekarang saya punya:
L'usine Foo Date: Détails de commande ------------------------- Nm.du Commande: [ ] Montant: [ ] Prix du Commande: [ ] Bonne journée.
Saya tidak benar-benar berbicara bahasa Prancis jadi abaikan kesalahan di sini. Lagi pula, posisi semua bidang sama persis, tetapi teks non-bidang-nilai berbeda. Saya ingin menerapkan penggantian ini ke semua file. Bagaimana saya mencapainya?
Jawaban:
Anda telah membuat peta pemformatan sehingga pekerjaan yang tersisa hanyalah mengganti regex. Membuat peta lebih sulit, terutama untuk teks yang lebih besar dan lebih rumit. saya menggunakan Teks Sublim untuk itu. Tetapi use case dan informasi lebih lanjut tidak jelas di sini, Anda harus membawanya ke softwarerecs.SE jika itu penting. Saya tetap menyertakan versi Python:
sumber