Karakter ganjil:
ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้ ก้้้้้้้้
Pertanyaan: Mengapa karakter ini sangat aneh ketika Anda melihatnya di Windows *?
Ini cuplikan dari Outlook untuk Anda para bajingan beruntung yang tidak dipaksa menggunakan Windows:
Terkait: Apa yang digunakan pengkodean karakter?
* Windows seperti pada OS. Aplikasi menggambar teks menggunakan GTK + dan suka tidak menunjukkan ini seperti sesuatu dari perjalanan LSD yang salah .
windows
characters
Marcus Hansson
sumber
sumber
Jawaban:
Sepertinya saya telah mengambil sedikit pukulan karena berpikir bahwa Windows "melakukannya dengan benar", saya merasa saya harus mengirim jawaban untuk membenarkan posisi saya.
Faktanya adalah bahwa teks yang Anda miliki memberitahu sistem operasi untuk membuat jumlah kombinasi karakter yang gila. Masalah bahwa satu sistem operasi benar-benar membuat mereka sementara yang lain tidak disebabkan oleh sejumlah masalah. Salah satu masalah ini adalah seberapa teliti programmer ketika mereka menulis kode untuk membuat mereka, yang lain akan disebabkan karena programmer terlalu malas untuk mengimplementasikannya dengan benar, jika sama sekali.
Pada dasarnya bermuara pada gagasan bahwa bahasa tertulis adalah hal-hal yang berubah- ubah , dan bahwa banyak karakter dalam bahasa tertentu memiliki beberapa diakritik yang berbeda yang diterapkan untuk memodifikasi pengucapan karakter. Bagaimana kita menangani semua diakritik ini, apakah kita memberikan setiap huruf dengan diakritik karakter baru (yang akan menghasilkan satu heck dari banyak karakter baru dan hampir identik) atau apakah kita membuat satu set karakter khusus untuk diakritik dan mengurangi kita alfabet keseluruhan?
Unicode memberi kita ruang untuk melakukan keduanya, tetapi dengan melakukan itu programmer yang harus membuat diakritik ini harus berurusan dengan fakta bahwa ada beberapa karakter yang benar-benar memiliki beberapa diakritik, satu di atas dan satu di bawah, dan kemudian programmer memiliki untuk menanyakan pertanyaan kapan mereka berhenti. Mereka dapat membatasi itu menjadi dua, dan memuaskan kebanyakan orang tetapi mengabaikan mereka yang ingin atau membutuhkan tiga diakritik untuk menulis secara resmi dalam bahasa mereka sendiri.
Microsoft, apakah benar atau salah, memutuskan untuk membiarkan pengguna memutuskan berapa banyak tanda tambahan yang ingin digunakan seseorang. Jalur ini membutuhkan programmer yang cukup baik dan beberapa rasionalisasi yang sulit untuk ditindaklanjuti. Saya sepenuhnya mendukung mereka baik dalam memungkinkan ini dan fakta bahwa mereka melakukannya dengan baik .
Jika karakter itu hilang, saya ingin tahu mengapa mereka hilang. Apakah itu keputusan "kita menjatuhkan ini di lantai setelah
x
diakritik", atau apakah karena programmer terlalu malas untuk melakukannya dengan benar dan berpotensi mengekspos saya ke beberapa buffer overflow dengan kode tersembunyi di diakritik yang akan dikeluarkan untuk dieksekusi oleh sistem?Masalah sederhana di sini adalah bahwa dengan benar-benar menampilkan karakter-karakter itu saya dapat melihat bahwa sistem melakukan persis apa yang diperintahkan untuk dilakukan, daripada melakukan apa yang dianggapnya benar atau, lebih buruk lagi, melakukan sesuatu yang berpotensi berbahaya .
sumber
Karena Windows mencoba untuk merender Unicode dalam jumlah besar yang mengkombinasikan karakter ketika teks Anda memuatnya, meskipun tidak ada skrip aktual yang akan menggabungkan banyak tanda menjadi satu.
sumber