Menyimpan "Bush menyembunyikan fakta" di notepad

54

Saat menyimpan teks "Bush sembunyikan fakta" di notepad di bawah Windows XP, bagaimana jika Anda membuka kembali itu menunjukkan kotak bukan teks?

Saya melihatnya di video ini jika Anda membutuhkan contoh

http://www.youtube.com/watch?v=9bK9-sc_uus&feature=related

John T
sumber
28
Ngomong-ngomong, itu sama untuk urutan 4-3-3-5 huruf apa pun, bukan hanya yang ini.
grawity
15
Contoh: "John eat the bacon"
Troggy

Jawaban:

93

Ini disebabkan oleh masalah dengan fungsi Win32 API IsTextUnicode yang berasal dari Windows NT 3.5. Jika file dikodekan dalam ANSI, fungsi akan menafsirkannya sebagai UTF-16LE yang menghasilkan karakter yang tidak dapat dibaca.

Ini membuat saya terpesona ketika saya menemukannya sejak saya masih muda dan naif, saya pikir itu adalah konspirasi yang sebenarnya :)

Sebenarnya ada artikel Wikipedia tentang ini yang bisa Anda temukan di sini .

John T
sumber
17
Menarik. +1 untuk artikel Wiki yang mengajari saya kata "mojibake" dan khususnya peringatan meta bahwa "tanpa dukungan render yang tepat, Anda dapat melihat tanda tanya, kotak, atau simbol lainnya ..." :-)
jtb
3
1 karena, walaupun menggunakan Windows selama yang saya ingat, saya entah bagaimana tidak pernah menemukan ini!
Jared Harley
7
Yah, ini jelas bug, karena perangkat lunaknya salah. Yang terbaik yang dapat Anda perdebatkan adalah bahwa bug seperti ini tidak mungkin untuk dihilangkan tanpa kehilangan fungsi lainnya. Dan, heck, Microsoft memperbaikinya di Vista [menurut Wiki], jadi seseorang di sana jelas mengira itu juga bug.
John Fouhy
11
Ini bukan bug jika melakukan persis apa yang diiklankan (mis. Didokumentasikan) untuk dilakukan. Ini ditentukan secara spesifik bahwa ini adalah uji statistik dan bukan sangat mudah, dan semakin pendek input, semakin tinggi tingkat kesalahan. Kebetulan dalam kasus ini, itu terjadi dengan kalimat yang masuk akal bagi manusia. Kalimat khusus ini tidak berfungsi dengan Vista & 7 karena penerapan IsTextUnicode telah diubah dan mungkin ditingkatkan dan sekarang dilaporkan dengan benar untuk kalimat ini. Apa yang kita miliki adalah tingkat positif / negatif palsu yang lebih baik atau lebih buruk, bukan bug.
KTC
5
"Itu bukan bug jika melakukan apa yang seharusnya." Ya mungkin istilah teknisnya adalah 'cacat desain' atau semacamnya, tapi saya pikir sebagian besar orang masih akan mengatakan itu tidak masalah untuk menyebutnya bug.
davr