Terkadang saya mengedit teks bahasa Inggris yang menyertakan karakter Unicode. Untuk beberapa alasan, pada PC saya, Notepad ++ mengonversi karakter Unicode menjadi dengan demikian merusak teks dan kehilangan semua data itu. Saya mencari cara untuk mengedit teks seperti itu, sambil mempertahankan karakter Unicode. Saya menggunakan Consolas sebagai Font saya. Jika font tidak memiliki semua karakter itu, mengapa saya harus kehilangan data ketika saya menyalin teks dari Notepad ++ (melalui clipboard Windows)?
notepad++
text-editing
unicode
Robinicks
sumber
sumber
Jawaban:
Jika file tersebut benar-benar dikodekan dalam Unicode, Notepad ++ akan mendeteksi secara otomatis. The Consolas font bekerja dengan baik bagi saya. Anda dapat mencoba salah satu dari dua opsi menu ini:
Saya cukup yakin yang pertama akan melakukan apa yang Anda inginkan.
sumber
Masalah yang dijelaskan dalam pertanyaan terjadi ketika dokumen kosong / baru diatur ke "ANSI", dan karakter Unicode disisipkan ke dalamnya.
Tidak ada deteksi otomatis saat digunakan dengan dokumen kosong / baru, setidaknya tidak dalam versi Notepad ++ yang saya uji (v5.4.5). "ANSI" adalah default di Notepad ++ untuk dokumen baru, kecuali jika diatur dalam menu Pengaturan → Preferensi → tab Dokumen Baru / Buka Simpan Direktori .
Larutan
Solusinya adalah dengan mengatur encoding ke UTF-8 sebelum menempel, menu Format → Encode di UTF-8 :
Contoh
Saya menyalin beberapa teks ke dokumen Notepad ++ baru, Rusia (русский язык, russkiy yazyk) , dari Firefox yang menampilkan halaman Wikipedia bahasa Rusia .
Jika pengkodean tidak diubah dari "ANSI" ini hasilnya:
Jika pengkodean yang berubah ini adalah hasilnya:
Seperti dapat dilihat pada gambar di bawah ini (bagian Cyrillic disorot), Notepad ++ sebenarnya mengubah karakter Unicode menjadi ASCII 63 (tanda heksadesimal 3F), tanda tanya. Itulah sebabnya karakter Unicode hilang (dalam mode "ANSI" ) ketika menyalin teks melalui clipboard (itu bukan masalah font - informasi hilang).
Diuji pada: Notepad ++ v5.4.5 (UNICODE).
sumber
Ada kabar baik dan kabar buruk.
Berita bagus: Notepad ++ mendukung Unicode (setidaknya dari apa yang bisa saya kumpulkan).
Berita buruk: Rupanya dukungan Unicode hanya ada di Windows XP.
Sebenarnya saya tidak punya mesin Windows di depan saya. Dari yang saya ingat, ada menu Encoding di bawah menu Format di suatu tempat. Pengkodean untuk Unicode sebenarnya paling umum adalah UTF-8.
Ini adalah gambar 'cantik' dari dukungan Unicode di Notepad ++,
sumber
Unicode berfungsi dengan baik di Windows 7. Satu-satunya masalah yang muncul adalah Anda harus mengetik ulang karakter yang telah diubah. Itu terjadi pada saya. Saya menulis dengan huruf Skandinavia jadi ä -> E4, ö -> F6. Ini adalah rasa sakit di pantat untuk menggantikan mereka semua, tapi itu sepadan.
Jika Anda menyandikan halaman dari ANSI -> UTF-8 maka akan ada beberapa masalah karakter.
Saya menyarankan agar Anda membuat halaman baru di UTF-8 dan kemudian menyalin / menempelkan informasi Anda. Tidak akan / seharusnya tidak ada masalah saat itu.
sumber
Ini bekerja untuk saya:
Saya mengubah font ke Courier New dalam konfigurator gaya pada PC saya (Windows 7 dengan set karakter Inggris / AS dan Rumania untuk non-Unicode set). Ini bekerja dengan font Courier New & Tahoma + encoding UTF-8.
sumber
Pada menu atas pilih
Encoding
kemudian pilihEncode in UTF-8
atauEncode in UTF-8 Without BOM
maka Anda dapat mengedit teks dalam Unicode encoding.sumber