Pertanyaan yang diberi tag encoding

109
ruby 1.9: urutan byte tidak valid di UTF-8

Saya menulis crawler di Ruby (1.9) yang mengkonsumsi banyak HTML dari banyak situs acak. Ketika mencoba mengekstrak tautan, saya memutuskan untuk menggunakan saja .scan(/href="(.*?)"/i)daripada nokogiri / hpricot (percepatan besar). Masalahnya adalah sekarang saya menerima banyak " invalid byte...

109
Ruang html ditampilkan sebagai% 2520, bukan% 20

Meneruskan nama file ke browser firefox menyebabkannya mengganti spasi dengan, %2520 bukan %20. Saya memiliki HTML berikut dalam sebuah file bernama myhtml.html: <img src="C:\Documents and Settings\screenshots\Image01.png"/> Saat saya memuat myhtml.htmlke firefox, gambar muncul sebagai...

105
Android. WebView dan loadData

Ini memungkinkan untuk menggunakan metode berikut untuk setelan konten dari tampilan web loadData (Data string, Jenis mimeTipe, Pengodean string) Bagaimana menangani masalah dengan pengkodean data html yang tidak diketahui ?! Apakah ada daftar pengkodean ?! Saya tahu dari kampus saya bahwa dalam...

102
Membaca karakter dari file dengan Python

Di file teks, ada string "Saya tidak suka ini". Namun, ketika saya membacanya menjadi string, itu menjadi "Saya tidak \ xe2 \ x80 \ x98t seperti ini". Saya memahami bahwa \ u2018 adalah representasi unicode dari "'". saya menggunakan f1 = open (file1, "r") text = f1.read() perintah untuk...