Menggunakan beberapa huruf secara keseluruhan untuk membatasi beberapa teks

0

Saya memiliki file html, yang berisi banyak / <| ^, beberapa teks di samping header sampah, kata-kata, dll. Saya ingin mengekstrak beberapa teks di antara seperangkat huruf, seperti "nbsp" dan pipa "|". Saya kehilangan informasi jika saya menggunakan "delims = nbsp" karena delims menganggapnya sebagai "n", "b", "s", dan "p". Bagaimana saya harus mendekati masalah, dan bagaimana saya bisa mengekstraksi banyak teks?

Teks contoh:

garbage nbsp; SOME_TEXT_1 | garbage
garbage nbsp; SOME_TEXT_2 | garbage
garbage nbsp; SOME_TEXT_3 | garbage
Wajdet
sumber

Jawaban:

0

Jika teks benar-benar sesederhana contoh Anda, ini akan melakukannya;

for /f "delims=^|; tokens=2" %a in (garbage.txt) do echo %a

Jika teks di sekitarnya berisi lebih banyak titik koma, Anda mungkin lebih mudah mendapatkan versi windows sed atau awk. Atau editor teks yang layak, jika itu adalah pekerjaan satu kali.

Berend
sumber