Jadi, HTML5 adalah Langkah Besar ke Depan, saya diberitahu. Langkah terakhir yang kami ambil yang saya sadari adalah pengenalan XHTML. Keuntungannya jelas: kesederhanaan, ketegasan, kemampuan untuk menggunakan parser dan generator XML standar untuk bekerja dengan halaman web, dan sebagainya.
Betapa aneh dan membuat frustasi, HTML5 menggulung semua itu: sekali lagi kami bekerja dengan sintaksis non-standar; sekali lagi, kita harus berurusan dengan bagasi historis dan kompleksitas parsing; sekali lagi kami tidak dapat menggunakan pustaka, parser, generator, atau transformer XML standar kami; dan semua keuntungan yang diperkenalkan oleh XML (ekstensibilitas, ruang nama, standardisasi, dan sebagainya), bahwa W3C menghabiskan satu dekade mendorong untuk alasan yang baik, hilang.
Baik, kami memiliki XHTML5, tetapi sepertinya belum mendapatkan popularitas seperti yang dimiliki pengkodean HTML5. Lihat pertanyaan SO ini , misalnya. Bahkan spesifikasi HTML5 mengatakan bahwa HTML5, bukan XHTML5, "adalah format yang disarankan untuk sebagian besar penulis."
Apakah saya salah fakta? Kalau tidak, mengapa saya satu-satunya yang merasakan hal ini? Mengapa orang memilih HTML5 daripada XHTML5?
<!DOCTYPE html>Hello World
<?xml version="1.0" encoding="iso-8859-1"?><!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "DTD/xhtml1-transitional.dtd"><html xml:lang="en" lang="en" xmlns="http://www.w3.org/1999/xhtml"><head><title></title></head><body>Hello World</body></html>
<!DOCTYPE html>Hello World
, bukan? Coba itu di validator ini .<!DOCTYPE html>Hello World!
, karena itu HTML5 yang benar-benar valid. Dokumen yang lebih pendek berarti lebih sedikit bandwidth yang setara dengan penghematan yang signifikan untuk perusahaan besar (sudahkah Anda melihat apa yang dikirim google untuk www.google.com?).Jawaban:
Saya akan merekomendasikan membaca Bagaimana Kami Sampai di Sini? . Mark Pilgrim memberikan sejarah HTML yang luar biasa dan singkat hingga HTML5.
Pada dasarnya, pemahaman saya adalah bahwa banyak halaman web bahkan tidak memanfaatkan "X" dari XHTML karena mereka tidak menentukan tipe MIME yang tepat untuk itu.
sumber
C
program mungkin akan tampak jauh lebih mirip dengan sebuahPython
program di mana semi-titik dua dan kurung sebagian besar bisa menghilang, dan apa yang akan tersisa adalah kode penting./past.html
tidak lagi tersedia di server ini dan tidak ada alamat penerusan.”Jika Anda menghasilkan html5 yang kompatibel dengan xml, dan mengirimkannya dengan xml sebagai tipe mime, maka parser xml akan digunakan untuk semua jazz yang bagus;)
EDIT: lihat itu untuk beberapa informasi lebih lanjut: http://wiki.whatwg.org/wiki/HTML_vs._XHTML
sumber
HTML5 adalah kesimpulan logis dan tak terhindarkan dari browser yang mengadopsi hukum Postel ("Jadilah liberal dalam apa yang Anda terima").
Setelah satu browser dengan pangsa pasar yang cukup mengadopsi prinsip ini, yang lain dipaksa untuk mengikuti, tidak hanya menjadi liberal dengan menerima konten yang tidak sesuai, tetapi juga merendernya dengan cara yang sama seperti yang dilakukan pesaing mereka. HTML5 adalah hasil logis dari situasi itu: vendor browser telah memutuskan bahwa karena mereka tidak akan menolak konten apa pun sebagai tidak valid (setidaknya, tidak pada level HTML - Javascript adalah masalah lain!) Mereka mungkin juga duduk di sekitar meja dan menyetujui interpretasi untuk apa pun yang mungkin dilontarkan oleh penulis konten. Dalam lingkungan ini, mereka tidak bereaksi dengan baik terhadap para geek standar yang mengatakan kepada mereka bahwa jika saja mereka menolak konten yang salah dari kata go, mereka tidak akan terlibat dalam kekacauan ini.
Jadi Anda dan saya bisa berteriak dari sela-sela dan memberi tahu vendor peramban dan penggunanya bahwa dunia akan menjadi tempat yang lebih baik jika mereka tidak percaya pada John Postel, tetapi kerusakan telah terjadi dan sangat sulit untuk membatalkannya.
sumber
Spesifikasi HTML5 sebenarnya telah sangat ditingkatkan dibandingkan spesifikasi HTML4. Secara khusus, penanganan kondisi kesalahan dan markup yang tidak valid sebenarnya distandarisasi, artinya semua browser yang menerapkan standar dengan benar akan menangani markup yang tidak valid dengan cara yang sama.
HTML ditulis oleh manusia lebih sering daripada tidak (biasanya bersamaan dengan semacam bahasa templating), dan manusia membuat kesalahan. Selama semua browser menangani kesalahan sintaks dengan cara yang sama, maka aturan "menjadi liberal dalam apa yang Anda terima" sangat dapat diterima.
Hanya ada sedikit keuntungan dalam menghasilkan XML yang valid, karena alat dan perpustakaan untuk menangani HTML (hampir) sama tersedia, dan HTML lebih mudah bagi manusia untuk menulis daripada XML.
sumber
Anda tidak akan pernah mendapatkan manfaat dari parser sederhana atau alat XML standar di sisi klien.
Ada miliaran halaman di web dalam HTML, beberapa di antaranya ditulis oleh orang yang sudah lama mati, jadi mereka tidak akan pernah diperbarui ke XML. Jadi, jika Anda ingin membuat agen pengguna yang bermanfaat secara umum, Anda harus dapat mem-parsing HTML kuno. Bisa dibilang XHTML hanya memperkenalkan kompleksitas tambahan karena membutuhkan mode parsing baru selain parsing HTML yang sudah Anda dukung.
Di sisi server Anda masih dapat memanfaatkan alat XML misalnya. menghasilkan XHTML menggunakan XSLT. Tetapi jika Anda tidak secara khusus menggunakan rantai alat XML, tidak ada manfaat menggunakan sintaks XML daripada hanya HTML.
(Anda tidak benar bahwa HTML adalah sintaks "non-standar". Sintaks HTML ditentukan dengan sangat teliti dalam spesifikasi HTML5, jadi ini sama standarnya dengan sintaks XML.)
sumber