Cara menampilkan beberapa file teks unicode dalam program non-unicode

2

OS: WinXP

Katakanlah saya mendapat beberapa file dalam bahasa Cina dan beberapa file dalam bahasa Korea. Dan di windows 'Opsi Wilayah dan Bahasa', saya mengatur bahasa untuk program non-unicode = Bahasa Mandarin. Apakah ada cara saya bisa membaca beberapa file teks Korea dalam editor teks dengan mudah tanpa menggunakan Microsoft Word?

Saya memerlukan lingkungan yang dapat mendukung beberapa unicode dengan mudah, saya perlu membaca Mandarin, Jepang, Korea dalam editor teks (Ultraeditor, notepad ++) dan klien terminal seperti SecureCRT. Mohon saran, terima kasih.

Pertanyaan cepat lainnya adalah bagaimana cara Word mengenali bahasa mana dalam file teks? Apakah ada informasi dalam teks?

Stan
sumber

Jawaban:

1

Katakanlah saya mendapat beberapa file dalam bahasa Cina dan beberapa file dalam bahasa Korea. Dan di windows 'Opsi Wilayah dan Bahasa', saya mengatur bahasa untuk program non-unicode = Bahasa Mandarin. Apakah ada cara saya bisa membaca beberapa file teks Korea dalam editor teks dengan mudah tanpa menggunakan Microsoft Word?

Ya, Anda perlu menggunakan editor yang mendukung banyak penyandian. Kebanyakan editor berfitur lengkap (notepad ++, (g) vim, dll.) Mendukung hal ini. Biasanya, Anda perlu memberi tahu editor yang memiliki penyandian file teks (karena informasi ini tidak ada dalam file itu sendiri), meskipun terkadang editor dapat menebaknya untuk Anda. Misalnya di Notepad ++ dan gvim ada pengaturan menu / konfigurasi untuk memilih pengkodean.

Saya perlu membaca Mandarin, Jepang, Korea dalam editor teks (Ultraeditor, notepad ++) dan klien terminal seperti SecureCRT. Mohon saran, terima kasih.

Untuk membaca di editor teks, lihat di atas. Mengenai "SecureCRT": Saya berasumsi maksud Anda file tersebut ada di server jarak jauh yang Anda akses melalui SecureCRT. Maka Anda perlu menggunakan editor pada sistem jarak jauh yang mendukung penyandian file.

Pertanyaan cepat lainnya adalah bagaimana cara Word mengenali bahasa mana dalam file teks? Apakah ada informasi dalam teks

Untuk file teks biasa, secara umum Anda tidak dapat memberi tahu penyandian. Namun, Anda dapat menebak (sebagian besar didasarkan pada frekuensi byte); mungkin inilah yang dilakukan oleh Word.

sleske
sumber
1
Saya memilih pengkodean sebagai bahasa Korea di Notepad ++ tetapi hanya melihat kotak. Apakah saya perlu menginstal font Korea dan mengatur font di notepad ++ juga? Apa yang hilang
Stan
1
Sulit dikatakan tanpa info tambahan. Tetapi Anda pasti membutuhkan font Korea, jika Anda belum memilikinya.
sleske
1

Saya tidak berpikir ada palin sama sekali yang mendukung beberapa pengkodean.

Notepad ++ tidak dapat menampilkan beberapa data yang disandikan dalam file yang sama.

Tetapi sangat mungkin bahwa Anda dapat menggunakan bahasa yang berbeda dalam file teks yang sama. Tetapi harus encoding yang sama.

Sebagai Contoh
日本 ini dalam bahasa Jepang বাংলাদেশ ini adalah bengali. 한국 (saya pikir ini bahasa Korea)

Tetapi semua menggunakan pengkodean yang sama (UTF-8 dalam kasus ini)

Dan tentu saja peramban yang Anda gunakan tidak dapat menampilkan dua penyandian bersamaan.

jika Anda memiliki ide pengembangan. Anda dapat mencoba tes sederhana tentang masalah penyandian. cobalah untuk mencetak dua data yang disandikan berbeda di halaman yang sama. Anda akan mendapatkan hasil sampah.

Tetapi jika Anda mungkin mendapatkan beberapa masalah yang cukup menarik di mana tampaknya Anda mendapatkan data dalam pengkodean yang berbeda ... sebagai contoh

katakanlah Anda memiliki dua file teks yang berbeda dengan dua enkode yang berbeda. 1. UTF-8 2. SHIFT-JIS

keduanya mengandung teks Jepang. Jika Anda menyalin beberapa teks dari satu file teks dan menempelkannya ke yang lain, Anda akan melihat paste yang berhasil. Anda harus bertanya bahwa mereka berbeda pengodean kenapa mereka disisipkan dalam file teks yang sama?

jawabannya adalah ketika Anda menyalin beberapa teks yang akan disalin dalam UNICODE dan juga disisipkan sebagai unicode (dengan sedikit pengetahuan pemrograman saya semua teks yang ditampilkan pada windows berada dalam unicode. Jika Anda tidak mengkonversi teks ke Unicode Anda tidak dapat mencetaknya dengan benar). Tetapi ketika pengguna menyimpan file, itu disimpan dalam penyandian yang tepat ....................

Johnny
sumber