Apa tipe konten yang benar untuk dokumen XML, HTML dan XHTML?
Saya perlu menulis crawler sederhana yang hanya mengambil jenis file ini.
Saat ini http://example.net/index.html dapat berfungsi sebagai contoh file JPEG karena mod_rewrite, jadi saya perlu memeriksa jenis konten dari header respons dan membandingkannya dengan daftar jenis konten yang diizinkan.
Dari mana saya bisa mendapatkan daftar seperti itu?
Jawaban:
HTML
text/html
:, titik.XHTML:
application/xhtml+xml
, atau hanya jika mengikuti pedoman HTML compatbility,text/html
. Lihat Catatan Jenis Media W3 .XML:
text/xml
,application/xml
( RFC 2376 ).Ada juga banyak jenis media lain yang berbasis di sekitar XML, misalnya
application/rss+xml
atauimage/svg+xml
. Ini adalah taruhan yang aman bahwa setiap akhiran yang tidak dikenali tetapi terdaftar+xml
adalah berbasis XML. Lihat daftar IANA untuk jenis media terdaftar yang diakhiri dengan+xml
.(Untuk
x-
jenis yang tidak terdaftar , semua taruhan dibatalkan, tetapi Anda berharap+xml
dihormati.)sumber
text/xml
danapplication/xml
lihat di sini stackoverflow.com/questions/4832357/…