Bagaimana cara mengganti Karakter Unicode di Notepad ++

3

Saya sudah mendapatkan file .xlf yang terlihat seperti gambar di bawah ini:

masukkan deskripsi gambar di sini

Saya bertanya-tanya bagaimana cara mencari dan mengganti karakter unicode "xE5" menjadi "æ" Saya pikir saya dapat mencari: ^ 0145 = xE5 dan mengganti "æ" , itu tidak berhasil.

Jika ini tidak memungkinkan, saya dapat menggunakan editor teks lain (misalnya ultraedit).

di sini adalah teks yang disisipkan dari file:

<?xml version="1.0" encoding="utf-8"?>
<xliff xmlns="urn:oasis:names:tc:xliff:document:1.2" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" version="1.2" xsi:schemaLocation="urn:oasis:names:tc:xliff:document:1.2 xliff-core-1.2-strict.xsd">
  <file xmlns:bind="http://bind.sorona.se" original="CTO12623_1_en-GB-da.xml" source-language="en" datatype="xml" date="2015-11-11T15:35:51Z" target-language="da" product-name="Anders_LP8504_151111" bind:file-id="78452" bind:file-hash="85075c54359fa47b087d6c67ec967f43">
    <header>
      <tool tool-name="Sorona TMS" tool-id="bind" tool-version="3.1.5" tool-company="Sorona Innovation" />
      <count-group name="word-count">
        <count count-type="total" unit="word">2743</count>
      </count-group>
    </header>
    <body>
      <trans-unit id="e1ca41ef868a74944745b8cd1dfa59e7" translate="yes" approved="no" restype="string" resname="p">
        <source>The trench compactor LP 8504 is a radio controlled trench compactor. It has a robust design and is suitable for compaction of medium to deep layers of cohesive and granular soils on limited areas such as trenches, construction back-fills and on roads. No other use is permitted.</source><seg-source><mrk mtype="seg" mid="1">The trench compactor LP 8504 is a radio controlled trench compactor. It has a robust design and is suitable for compaction of medium to deep layers of cohesive and granular soils on limited areas such as trenches, construction back-fills and on roads. No other use is permitted.</mrk></seg-source>
        <target state="translated"><mrk mtype="seg" mid="1">Vibrationstromlen LP 8504 er radiostyret. Den har et robust design og er beregnet til komprimering af middel til dybe lag af sammenh篧ende og granuleret jord p塢egr篳ede omr楥r s塳om gr𦴥r, anl稳opfyldninger og p塶eje. Den m塩kke anvendes til andre form欮</mrk></target>
      </trans-unit>
      <trans-unit id="3b3dbf229f5f1f06ab9427d689c9740b" translate="yes" approved="no" restype="string" resname="p">
        <source>The LP trench compactor must only be used in well-ventilated areas, as is the case for all combustion engine machines.</source><seg-source><mrk mtype="seg" mid="2">The LP trench compactor must only be used in well-ventilated areas, as is the case for all combustion engine machines.</mrk></seg-source>
        <target state="translated"><mrk mtype="seg" mid="2">LP vibrationstromlen m塬ige som alle andre maskiner med forbr篤ingsmotorer kun bruges i godt ventilerede omr楥r.</mrk></target>
      </trans-unit>
      <trans-unit id="3ceced74b90bcbc582c1857395a8abf1" translate="yes" approved="no" restype="string" resname="p">
        <source>The LP trench compactor must not be towed behind vehicles.</source><seg-source><mrk mtype="seg" mid="3">The LP trench compactor must not be towed behind vehicles.</mrk></seg-source>
        <target state="translated"><mrk mtype="seg" mid="3">LP vibrationstromlen m塩kke sl磥s efter biler.</mrk></target>
      </trans-unit>
      <trans-unit id="c1ff7c8ab3ea4123fc2d5fb6a105d98b" translate="yes" approved="no" restype="string" resname="p">
        <source>Handbrake</source><seg-source><mrk mtype="seg" mid="4">Handbrake</mrk></seg-source>
        <target state="translated"><mrk mtype="seg" mid="4">H毤bremse</mrk></target>
      </trans-unit>
    </body>
  </file>
</xliff>

Saya juga telah melampirkan file xlf di sini adalah sebuah tautan:
Ini adalah tautan untuk mengunduh xlf

Ada saran?

XsiSec
sumber
Harap edit dan tambahkan contoh teks yang dapat kami salin dan kerjakan.
DavidPostill
@ DavidPostill yang saya lakukan Posting kode juga melampirkan file. jadi ini pilihan Anda yang paling sesuai dengan kebutuhan Anda :)
XsiSec

Jawaban:

4

Saya bertanya-tanya bagaimana cara mencari dan mengganti karakter unicode xE5"denganæ

Perhatikan bahwa æsebenarnya Unicode 00E6tidak 00E5.

Cari dan ganti bukan cara yang tepat untuk menampilkan karakter yang benar.

<?xml version="1.0" encoding="utf-8"?>

Status penyandian di atas adalah utf-8tetapi file tersebut sebenarnya disandikan sebagai ANSI.

Anda perlu mengonversi file dengan benar UTF-8, sebagai berikut:

  1. Buka Testfile.xlf

  2. File terlihat seperti:

    masukkan deskripsi gambar di sini

    Unicode salah ditampilkan.

  3. Menu> Pengkodean > Pilih Pengkodean dalam ANSI

    masukkan deskripsi gambar di sini

  4. File terlihat seperti:

    masukkan deskripsi gambar di sini

    Unicode ditampilkan dengan benar.

  5. Pilih semua konten file ( ctrl+ a)

  6. Menu> Pengkodean > Pilih Konversi ke UTF-8

    masukkan deskripsi gambar di sini

  7. Simpan File ( ctrl+ s)

  8. Tutup dan buka kembali.

  9. File sekarang dikodekan dengan benar sebagai karakter UTF-8 dan Unicode ditampilkan dengan benar.


Bagaimana Anda bisa melihat file tersebut sebenarnya ANSI?

fileUtilitas cygwin menunjukkan ini (sebelum dan sesudah konversi):

DavidPostill@Hal /f/test
$ file -i Testfile*.xlf
Testfile.xlf:          application/xml; charset=iso-8859-1
TestfileConverted.xlf: application/xml; charset=utf-8
DavidPostill
sumber
Jawaban sempurna! salah satu yang lebih baik menjawab banyak terima kasih!
XsiSec
Bagaimana Anda bisa melihat file tersebut sebenarnya ANSI? dan saya mengerti deklarasi mengatakan: encoding-utf-8.
XsiSec
Saya menggunakan fileutilitas cygwin . Saya sudah memperbarui jawabannya.
DavidPostill
Jawaban diperbarui. Gulir ke ujung.
DavidPostill
Kamu menyelamatkan hariku!
Matteo Conta
0

Jika Anda ingin menghapus UTF-8 / unicode chars seluruhnya, klik Encodingdi NPP dan lakukan langkah-langkah berikut, secara berurutan:

  1. Pilih Encode di UTF-8 (jika saat ini dalam ANSI)
  2. Pilih Konversi ke ANSI (juga di bawah penyandian)
  3. Menyimpan file

Ketika saya melakukan itu, semua karakter UTF-8 / unicode hilang.

HerrimanCoder
sumber