Saya sudah mendapatkan file .xlf yang terlihat seperti gambar di bawah ini:
Saya bertanya-tanya bagaimana cara mencari dan mengganti karakter unicode "xE5" menjadi "æ" Saya pikir saya dapat mencari: ^ 0145 = xE5 dan mengganti "æ" , itu tidak berhasil.
Jika ini tidak memungkinkan, saya dapat menggunakan editor teks lain (misalnya ultraedit).
di sini adalah teks yang disisipkan dari file:
<?xml version="1.0" encoding="utf-8"?>
<xliff xmlns="urn:oasis:names:tc:xliff:document:1.2" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" version="1.2" xsi:schemaLocation="urn:oasis:names:tc:xliff:document:1.2 xliff-core-1.2-strict.xsd">
<file xmlns:bind="http://bind.sorona.se" original="CTO12623_1_en-GB-da.xml" source-language="en" datatype="xml" date="2015-11-11T15:35:51Z" target-language="da" product-name="Anders_LP8504_151111" bind:file-id="78452" bind:file-hash="85075c54359fa47b087d6c67ec967f43">
<header>
<tool tool-name="Sorona TMS" tool-id="bind" tool-version="3.1.5" tool-company="Sorona Innovation" />
<count-group name="word-count">
<count count-type="total" unit="word">2743</count>
</count-group>
</header>
<body>
<trans-unit id="e1ca41ef868a74944745b8cd1dfa59e7" translate="yes" approved="no" restype="string" resname="p">
<source>The trench compactor LP 8504 is a radio controlled trench compactor. It has a robust design and is suitable for compaction of medium to deep layers of cohesive and granular soils on limited areas such as trenches, construction back-fills and on roads. No other use is permitted.</source><seg-source><mrk mtype="seg" mid="1">The trench compactor LP 8504 is a radio controlled trench compactor. It has a robust design and is suitable for compaction of medium to deep layers of cohesive and granular soils on limited areas such as trenches, construction back-fills and on roads. No other use is permitted.</mrk></seg-source>
<target state="translated"><mrk mtype="seg" mid="1">Vibrationstromlen LP 8504 er radiostyret. Den har et robust design og er beregnet til komprimering af middel til dybe lag af sammenh篧ende og granuleret jord p塢egr篳ede omr楥r s塳om gr𦴥r, anl稳opfyldninger og p塶eje. Den m塩kke anvendes til andre form欮</mrk></target>
</trans-unit>
<trans-unit id="3b3dbf229f5f1f06ab9427d689c9740b" translate="yes" approved="no" restype="string" resname="p">
<source>The LP trench compactor must only be used in well-ventilated areas, as is the case for all combustion engine machines.</source><seg-source><mrk mtype="seg" mid="2">The LP trench compactor must only be used in well-ventilated areas, as is the case for all combustion engine machines.</mrk></seg-source>
<target state="translated"><mrk mtype="seg" mid="2">LP vibrationstromlen m塬ige som alle andre maskiner med forbr篤ingsmotorer kun bruges i godt ventilerede omr楥r.</mrk></target>
</trans-unit>
<trans-unit id="3ceced74b90bcbc582c1857395a8abf1" translate="yes" approved="no" restype="string" resname="p">
<source>The LP trench compactor must not be towed behind vehicles.</source><seg-source><mrk mtype="seg" mid="3">The LP trench compactor must not be towed behind vehicles.</mrk></seg-source>
<target state="translated"><mrk mtype="seg" mid="3">LP vibrationstromlen m塩kke sl磥s efter biler.</mrk></target>
</trans-unit>
<trans-unit id="c1ff7c8ab3ea4123fc2d5fb6a105d98b" translate="yes" approved="no" restype="string" resname="p">
<source>Handbrake</source><seg-source><mrk mtype="seg" mid="4">Handbrake</mrk></seg-source>
<target state="translated"><mrk mtype="seg" mid="4">H毤bremse</mrk></target>
</trans-unit>
</body>
</file>
</xliff>
Saya juga telah melampirkan file xlf di sini adalah sebuah tautan:
Ini adalah tautan untuk mengunduh xlf
Ada saran?
find-and-replace
XsiSec
sumber
sumber
Jawaban:
Saya bertanya-tanya bagaimana cara mencari dan mengganti karakter unicode
xE5
"denganæ
Perhatikan bahwa
æ
sebenarnya Unicode00E6
tidak00E5
.Cari dan ganti bukan cara yang tepat untuk menampilkan karakter yang benar.
Status penyandian di atas adalah
utf-8
tetapi file tersebut sebenarnya disandikan sebagaiANSI
.Anda perlu mengonversi file dengan benar
UTF-8
, sebagai berikut:Buka Testfile.xlf
File terlihat seperti:
Unicode salah ditampilkan.
Menu> Pengkodean > Pilih Pengkodean dalam ANSI
File terlihat seperti:
Unicode ditampilkan dengan benar.
Pilih semua konten file ( ctrl+ a)
Menu> Pengkodean > Pilih Konversi ke UTF-8
Simpan File ( ctrl+ s)
Tutup dan buka kembali.
File sekarang dikodekan dengan benar sebagai karakter UTF-8 dan Unicode ditampilkan dengan benar.
Bagaimana Anda bisa melihat file tersebut sebenarnya ANSI?
file
Utilitas cygwin menunjukkan ini (sebelum dan sesudah konversi):sumber
file
utilitas cygwin . Saya sudah memperbarui jawabannya.Jika Anda ingin menghapus UTF-8 / unicode chars seluruhnya, klik
Encoding
di NPP dan lakukan langkah-langkah berikut, secara berurutan:Ketika saya melakukan itu, semua karakter UTF-8 / unicode hilang.
sumber