Pertanyaan yang diberi tag utf-8

96
Membaca InputStream sebagai UTF-8

Saya mencoba membaca dari text/plainfile melalui internet, baris demi baris. Kode yang saya miliki sekarang adalah: URL url = new URL("http://kuehldesign.net/test.txt"); BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream())); LinkedList<String> lines = new...

96
Contoh string utf8 tidak valid?

Saya menguji bagaimana beberapa kode saya menangani data yang buruk, dan saya memerlukan beberapa seri byte yang UTF-8 tidak valid. Bisakah Anda memposting beberapa, dan idealnya, penjelasan mengapa itu buruk / di mana Anda mendapatkannya?

94
Membaca file CSV UTF8 dengan Python

Saya mencoba membaca file CSV dengan karakter beraksen dengan Python (hanya karakter Prancis dan / atau Spanyol). Berdasarkan dokumentasi Python 2.5 untuk csvreader ( http://docs.python.org/library/csv.html ), saya menemukan kode berikut untuk membaca file CSV karena csvreader hanya mendukung...

94
Cara elegan untuk mencari file UTF-8 dengan BOM?

Untuk tujuan debugging, saya perlu mencari direktori secara rekursif untuk semua file yang dimulai dengan UTF-8 byte order mark (BOM). Solusi saya saat ini adalah skrip shell sederhana: find -type f | while read file do if [ "`head -c 3 -- "$file"`" == $'\xef\xbb\xbf' ] then echo "found BOM...