Saya memiliki file XML mirip pohon yang sangat besar, sekitar 1 GB.
Saya perlu menghapus baris <Sample> ... </Sample>
termasuk subline di dalam <Sample> ... </Sample>
yang tidak mengandung nilai <segmentation><![CDATA[0.11]]></segmentation>
.
Misalnya, ada baris dengan tag sebagai berikut:
<segmentation><![CDATA[0.11]]></segmentation>
<segmentation><![CDATA[0.25]]></segmentation>
<segmentation><![CDATA[0.61]]></segmentation>
Dalam contoh di bawah ini, apakah mungkin untuk menghapus semua <Sample>
baris dan subline dengan tetap hanya <Sample>
menyertakan subline dengan tag <segmentation><![CDATA[0.11]]></segmentation>
?
Awal:
<Sample>
<title><![CDATA[South Park]]></title>
<date><![CDATA[Tue, 29 Nov 2016 00:00:00 EST]]></date>
<referencenumber><![CDATA[20983990]]></referencenumber>
<segmentation><![CDATA[0.11]]></segmentation>
<description><![CDATA[Some text goes here]]></description>
</Sample>
<Sample>
<title><![CDATA[South Park]]></title>
<date><![CDATA[Tue, 29 Nov 2016 00:00:00 EST]]></date>
<referencenumber><![CDATA[20983990]]></referencenumber>
<segmentation><![CDATA[0.25]]></segmentation>
<description><![CDATA[Some text goes here]]></description>
</Sample>
<Sample>
<title><![CDATA[South Park]]></title>
<date><![CDATA[Tue, 29 Nov 2016 00:00:00 EST]]></date>
<referencenumber><![CDATA[20983990]]></referencenumber>
<segmentation><![CDATA[0.61]]></segmentation>
<description><![CDATA[Some text goes here]]></description>
</Sample>
Hasil:
<Sample>
<title><![CDATA[South Park]]></title>
<date><![CDATA[Tue, 29 Nov 2016 00:00:00 EST]]></date>
<referencenumber><![CDATA[20983990]]></referencenumber>
<segmentation><![CDATA[0.11]]></segmentation>
<description><![CDATA[Some text goes here]]></description>
</Sample>
Alih-alih mencari / mengganti, gunakan transformasi XSL . Di Notepad ++, didukung oleh plugin XML Tools yang dapat Anda temukan menggunakan Plugin Manager .
miroxlav
1
Peringatan: kemungkinan drive-by user. OP belum terlihat sejak dia menanyakan pertanyaan ini.
Scott