Pertanyaan yang diberi tag unicode

Unicode dimaksudkan sebagai rangkaian karakter universal untuk mendeskripsikan semua karakter yang diperlukan untuk teks tertulis yang menggabungkan semua sistem penulisan, simbol teknis, dan tanda baca.

432
Haruskah UTF-16 dianggap berbahaya?

Saya akan bertanya apa yang mungkin merupakan pertanyaan yang cukup kontroversial: "Haruskah salah satu pengkodean paling populer, UTF-16, dianggap berbahaya?" Mengapa saya menanyakan pertanyaan ini? Berapa banyak programmer yang menyadari fakta bahwa UTF-16 sebenarnya adalah penyandian panjang...

41
Mengapa ada beberapa pengkodean Unicode?

Saya pikir Unicode dirancang untuk mengatasi seluruh masalah memiliki banyak pengkodean yang berbeda karena ruang alamat kecil (8 bit) di sebagian besar upaya sebelumnya (ASCII, dll.). Lalu mengapa ada begitu banyak pengkodean Unicode? Bahkan beberapa versi dari yang (pada dasarnya) sama, seperti...

35
Lisensi Unicode

Ketentuan Penggunaan Unicode menyatakan bahwa perangkat lunak apa pun yang menggunakan file data mereka (atau modifikasi dari mereka) harus membawa referensi lisensi Unicode. Menurut saya, sebagian besar pustaka Unicode memiliki fungsi untuk memeriksa apakah sebuah karakter adalah digit, huruf,...

19
Mengapa ada begitu banyak spasi dan garis terputus di Unicode?

Unicode mungkin memiliki 50 ruang \ u0009 \ u000A- \ u000D \ u0020 \ u0085 \ u00A0 \ u1680 \ u180E \ u2000A \ u200A \ u2028 \ u2029 \ u202F \ u205F \ u3000] [\ u0009 \ u000A- \ u00020 \ u0085 \ u0085 \ u0085 \ u0085 u180E \ u2000- \ u200A \ u2028 \ u2029 \ u202F \ u205F \ u3000 dan 6 jeda...

14
Nilai sentinel Unicode yang dapat saya gunakan?

Saya mendesain format file dan saya ingin melakukannya dengan benar. Karena ini adalah format biner, byte pertama (atau byte) dari file tidak boleh membentuk karakter tekstual yang valid (seperti pada header file PNG 1 ). Ini memungkinkan alat yang tidak mengenali format untuk tetap melihat bahwa...

12
Implementasi Trie yang efisien untuk string unicode

Saya telah mencari implementasi String trie yang efisien. Sebagian besar saya telah menemukan kode seperti ini: Implementasi referensial di Jawa (per wikipedia) Saya tidak menyukai implementasi ini karena sebagian besar dua alasan: Mereka hanya mendukung 256 karakter ASCII. Saya perlu membahas...