Bagaimana saya bisa mengedit teks Unicode di Notepad ++?

26

Terkadang saya mengedit teks bahasa Inggris yang menyertakan karakter Unicode. Untuk beberapa alasan, pada PC saya, Notepad ++ mengonversi karakter Unicode menjadi dengan demikian merusak teks dan kehilangan semua data itu. Saya mencari cara untuk mengedit teks seperti itu, sambil mempertahankan karakter Unicode. Saya menggunakan Consolas sebagai Font saya. Jika font tidak memiliki semua karakter itu, mengapa saya harus kehilangan data ketika saya menyalin teks dari Notepad ++ (melalui clipboard Windows)?

Robinicks
sumber
Mungkinkah Anda menggunakan plugin yang tidak mendukung Unicode?
Ivo Flipse
Jika itu adalah tanda tanya di dalam kotak, maka itu sebenarnya mesin terbang font untuk mesin terbang yang hilang dan data Anda tidak hilang.
Joey
Tidak, itu tidak ada di dalam kotak, melainkan di dataran '?' karakter. Dikonfirmasi
Robinicks
1
Anda mungkin perlu mengubah font. lihat superuser.com/questions/16831/…
RamyenHead

Jawaban:

15

Jika file tersebut benar-benar dikodekan dalam Unicode, Notepad ++ akan mendeteksi secara otomatis. The Consolas font bekerja dengan baik bagi saya. Anda dapat mencoba salah satu dari dua opsi menu ini:

  • Pengkodean -> Pengkodean dalam UTF-8
  • Pengkodean -> Konversikan ke UTF-8

Saya cukup yakin yang pertama akan melakukan apa yang Anda inginkan.

DisgruntledGoat
sumber
Saya tidak memiliki menu Format.
Val
1
Untuk anak cucu, Anda memerlukan menu Pengkodean, bukan Format
Ken Bellows
15

Masalah yang dijelaskan dalam pertanyaan terjadi ketika dokumen kosong / baru diatur ke "ANSI", dan karakter Unicode disisipkan ke dalamnya.

Tidak ada deteksi otomatis saat digunakan dengan dokumen kosong / baru, setidaknya tidak dalam versi Notepad ++ yang saya uji (v5.4.5). "ANSI" adalah default di Notepad ++ untuk dokumen baru, kecuali jika diatur dalam menu PengaturanPreferensi → tab Dokumen Baru / Buka Simpan Direktori .

Larutan

Solusinya adalah dengan mengatur encoding ke UTF-8 sebelum menempel, menu FormatEncode di UTF-8 :

Perintah menu "Format menu / Encode dalam UTF-8" akan segera dieksekusi

Contoh

Saya menyalin beberapa teks ke dokumen Notepad ++ baru, Rusia (русский язык, russkiy yazyk) , dari Firefox yang menampilkan halaman Wikipedia bahasa Rusia .

Jika pengkodean tidak diubah dari "ANSI" ini hasilnya:

Hasil menempelkan string Unicode "Rusia (русский язык, russkiy yazyk" ke dokumen Notepad ++ baru tanpa mengubah pengkodean dari default "ANSI".

Jika pengkodean yang berubah ini adalah hasilnya:

Hasil menempelkan string Unicode "Rusia (русский язык, russkiy yazyk" ke dokumen Notepad ++ baru setelah mengubah pengkodean dari default "ANSI" ke "UTF-8".

Seperti dapat dilihat pada gambar di bawah ini (bagian Cyrillic disorot), Notepad ++ sebenarnya mengubah karakter Unicode menjadi ASCII 63 (tanda heksadesimal 3F), tanda tanya. Itulah sebabnya karakter Unicode hilang (dalam mode "ANSI" ) ketika menyalin teks melalui clipboard (itu bukan masalah font - informasi hilang).

Cuplikan layar tampilan hex dokumen tersebut

Diuji pada: Notepad ++ v5.4.5 (UNICODE).

Peter Mortensen
sumber
5

Ada kabar baik dan kabar buruk.

Berita bagus: Notepad ++ mendukung Unicode (setidaknya dari apa yang bisa saya kumpulkan).

Berita buruk: Rupanya dukungan Unicode hanya ada di Windows XP.

Sebenarnya saya tidak punya mesin Windows di depan saya. Dari yang saya ingat, ada menu Encoding di bawah menu Format di suatu tempat. Pengkodean untuk Unicode sebenarnya paling umum adalah UTF-8.

Ini adalah gambar 'cantik' dari dukungan Unicode di Notepad ++,

masukkan deskripsi gambar di sini

Josh Hunt
sumber
3

Unicode berfungsi dengan baik di Windows 7. Satu-satunya masalah yang muncul adalah Anda harus mengetik ulang karakter yang telah diubah. Itu terjadi pada saya. Saya menulis dengan huruf Skandinavia jadi ä -> E4, ö -> F6. Ini adalah rasa sakit di pantat untuk menggantikan mereka semua, tapi itu sepadan.

Jika Anda menyandikan halaman dari ANSI -> UTF-8 maka akan ada beberapa masalah karakter.

Saya menyarankan agar Anda membuat halaman baru di UTF-8 dan kemudian menyalin / menempelkan informasi Anda. Tidak akan / seharusnya tidak ada masalah saat itu.

Peter Mortensen
sumber
1

Ini bekerja untuk saya:

Saya mengubah font ke Courier New dalam konfigurator gaya pada PC saya (Windows 7 dengan set karakter Inggris / AS dan Rumania untuk non-Unicode set). Ini bekerja dengan font Courier New & Tahoma + encoding UTF-8.

rapy rapy
sumber
0

Pada menu atas pilih Encodingkemudian pilih Encode in UTF-8atau Encode in UTF-8 Without BOMmaka Anda dapat mengedit teks dalam Unicode encoding.

Siavash
sumber