Pertanyaan yang diberi tag utf-8

UTF-8 adalah pengkodean karakter yang menggambarkan setiap titik kode Unicode menggunakan urutan byte satu hingga empat byte. Ini kompatibel dengan ASCII sementara tetap mendukung representasi semua poin kode Unicode.

1191
UTF-8 terus berlanjut

Saya sedang menyiapkan server baru dan ingin mendukung UTF-8 sepenuhnya dalam aplikasi web saya. Saya telah mencoba ini di masa lalu pada server yang ada dan sepertinya selalu harus kembali ke ISO-8859-1. Di mana tepatnya saya perlu mengatur pengkodean / rangkaian karakter? Saya sadar bahwa saya...

557
Mengapa Perl modern menghindari UTF-8 secara default?

Saya bertanya-tanya mengapa sebagian besar solusi modern yang dibangun menggunakan Perl tidak mengaktifkan UTF-8 secara default. Saya mengerti ada banyak masalah warisan untuk skrip Perl inti, di mana ia dapat merusak banyak hal. Tapi, dari sudut pandang saya, dalam 21 st abad, proyek-proyek baru...

487
UTF-8, UTF-16, dan UTF-32

Apa perbedaan antara UTF-8, UTF-16, dan UTF-32? Saya mengerti bahwa mereka semua akan menyimpan Unicode, dan masing-masing menggunakan jumlah byte yang berbeda untuk mewakili karakter. Apakah ada keuntungan memilih satu dari yang

395
Apa itu Unicode, UTF-8, UTF-16?

Apa dasar untuk Unicode dan mengapa kebutuhan untuk UTF-8 atau UTF-16? Saya telah meneliti ini di Google dan mencari di sini juga tetapi tidak jelas bagi saya. Dalam VSS ketika melakukan perbandingan file, kadang-kadang ada pesan yang mengatakan bahwa kedua file memiliki UTF yang berbeda. Mengapa...

367
Bagaimana agar UTF-8 berfungsi di webapps Java?

Saya perlu membuat UTF-8 bekerja di webapp Java saya (servlets + JSP, tidak ada kerangka kerja yang digunakan) untuk mendukung äöådll untuk teks Finlandia biasa dan huruf Cyrillic seperti ЦжФuntuk kasus khusus. Setup saya adalah sebagai berikut: Lingkungan pengembangan: Windows XP Lingkungan...

362
Mengatur penyandian karakter Java default

Bagaimana cara mengatur pengkodean karakter default yang digunakan oleh JVM (1.5.x) secara terprogram? Saya telah membaca bahwa -Dfile.encoding=whateverdulu cara untuk pergi untuk JVM yang lebih tua. Saya tidak memiliki kemewahan itu untuk alasan saya tidak mau masuk. Saya telah...

304
Deteksi penyandian dan buat semuanya UTF-8

Saya membacakan banyak teks dari berbagai umpan RSS dan memasukkannya ke dalam basis data saya. Tentu saja, ada beberapa pengkodean karakter yang berbeda yang digunakan dalam umpan, misalnya UTF-8 dan ISO 8859-1. Sayangnya, terkadang ada masalah dengan penyandian teks. Contoh: "Ss" di "Fußball"...

279
UTF-8: Umum? Tempat sampah? Unicode?

Saya mencoba mencari tahu susunan apa yang harus saya gunakan untuk berbagai jenis data. 100% dari konten yang akan saya simpan dikirimkan oleh pengguna. Pemahaman saya adalah bahwa saya harus menggunakan UTF-8 General CI (Case-Insensitive) daripada UTF-8 Binary. Namun, saya tidak dapat menemukan...