Keuntungan Format DOCX Daripada DOC

9

Hari ini saya secara tidak sengaja menemukan bahwa .docx adalah .zip yang sama (atau tidak ada perbedaan besar di antara mereka). Ketika Anda mengubah .docx ke .zip dan buka dengan WinRAR Anda melihat banyak file XML di folder. Dalam file XML itu disimpan teks, font, pemilik, terakhir diubah dan sebagainya. Singkatnya, semua informasi disimpan sebagai data XML.

Tetapi hal yang sama tidak tepat untuk file ekstensi .doc. Tidak mungkin untuk membukanya sebagai .zip op as .rar.

Jadi pertanyaan: Apa keuntungan menyimpan data .docx dalam XML sehingga Microsoft mengubah cara menyimpan data? Memang saya ingin tahu bukan keuntungan dari format XML tetapi mengapa Microsoft menggunakan beberapa file XML untuk menyimpan data .docx. Ternyata .docx bukan format baru di root.

Narek
sumber
Dalam 1 Menit .. 5 jawaban yang hampir sama. Kekuatan SO.
MRG
1
Memiliki data dalam format XML tidak berarti itu bukan format baru. Anda tidak dapat memberi makan XML itu ke OpenOffice dan membuatnya render dengan benar. Anda harus jelas mendefinisikan apa yang akan struktur XML, atribut apa, apa elemen dll
1
Pertimbangkan mengubah judul menjadi sesuatu yang lebih informatif.
Carl Bergquist
2
Tentu saja ini format baru. Ayo sekarang.
Yth Janis Veinbergs dan Kyle Rozendo Saya telah sering bekerja dengan XML dan XSD dan saya tahu cara kerjanya !!! Berhati-hatilah aku berkata "di root". Anda tidak dapat setuju bahwa ini adalah format XML yang baru saja digunakan, bukan format baru !!!!
Narek

Jawaban:

12

Sebuah .docxfile yang dapat menyimpan sumber daya tertanam, seperti file gambar, bukan hanya file XML. Alih-alih menyandikan hal-hal di base64 atau sesuatu dan menyimpannya dalam file XML atau menemukan format serialisasi biner, mereka memutuskan untuk menggunakan format ZIP standar.

Selain itu, XML adalah format file yang sangat verbose yang mengandung banyak pola berlebihan. Anda bisa mendapatkan rasio kompresi yang tinggi untuk file XML.

Ngomong-ngomong, aku tidak benar-benar mendapatkan bagian "menipu kita". Apakah lebih baik untuk menciptakan format file cryptic baru dari awal atau menggunakan format standar yang dikenal?

Mehrdad Afshari
sumber
Manfaat utama yang saya lihat adalah bahwa ada Open API untuk benar-benar membuat file-file ini, jadi membuat file .docx dari awal dimungkinkan tanpa menghabiskan banyak pada SDK eksklusif. Microsoft SDK bahkan memasok reflektor dokumen yang akan menghasilkan kode C # untuk menghasilkan dokumen yang dibuat sebelumnya dari awal.
Will Eddins
@ Guard: Ya. Jawaban saya membahas versi asli pertanyaan. Pertanyaannya telah berubah secara signifikan sejak saat itu;) Judul aslinya adalah "Microsoft menipu?"
Mehrdad Afshari
xml sendiri tidak menjadikan format "dikenal", .docx menjadi salah satu contoh terbaik.
artistoex
5

The Artikel Wikipedia merangkum cukup baik:

"Microsoft mendapat tekanan yang meningkat untuk mengadopsi format file terbuka, khususnya beberapa negara mengadopsi aturan bahwa dokumen resmi harus dalam format terbuka."

Sunting: Dan men-zip-nya sangat masuk akal, karena XML sangat verbose, dan secara alami mengompres dengan sangat baik.

Henning
sumber
3
"Buka" tidak berarti "dapat dibuka ritsleting".
Greg Hewgill
3
Zip memiliki kelebihan lain selain kompresi. Kerjanya juga sebagai wadah untuk banyak file.
Joey
3

Menggunakan file berganti nama .zip adalah praktik yang cukup umum - misalnya file .pak Quake III benar-benar file .zip. Tidak ada gunanya menemukan format file terkompresi Anda sendiri ketika sudah ada yang sangat baik.

Greg
sumber
1
Lebih banyak contoh menggunakan arsip ZIP: Java .jar, Winamp .wsz/ .wal(skins), Firefox .xpi(XPInstaller - themes, addons). ( tarArsip juga populer.)
user1686
1

Bukan hanya Office Open XML yang menggunakan zip zip. OpenDocument Open Office melakukan hal yang sama di belakang layar.

Ada beberapa keuntungan yang tercantum di halaman Wikipedia pada Konvensi Pengemasan Terbuka :

Tipuan

Ambil contoh katalog di mana logo diulang 1.000 kali. Menggunakan mekanisme tipuan, jika kita ingin mengubah logo kita hanya perlu mengubah satu entri dalam satu file, tanpa melibatkan pencarian karena kita tahu di mana mencarinya. Ini meningkatkan pemeliharaan secara substansial. Jika Anda ingin mengubah tata letak, katakanlah, direktori ZIP tempat file Anda disimpan, itu menjadi masalah sepele, karena Anda tidak perlu tahu setiap elemen yang dapat menunjuk ke file, mereka semua berada di satu tempat.

Chunking

Ini mendorong dokumen untuk dipecah menjadi potongan-potongan kecil. Ini lebih baik untuk mengurangi efek korupsi file. Dan lebih baik untuk akses data: misalnya, semua informasi gaya dalam satu bagian XML, masing-masing lembar kerja atau tabel terpisah di bagian yang berbeda. Ini memungkinkan akses yang lebih cepat dan lebih sedikit pembuatan objek untuk klien, dan membuatnya lebih mudah untuk beberapa proses bekerja pada dokumen yang sama.

Chunking juga menguntungkan pemrogram. Mengganti satu stylesheet dengan yang lain menjadi operasi file ZIP, bukan operasi XML. Dan itu mengurangi jumlah hal yang perlu dipahami oleh seorang programmer, karena mereka dapat mendekati potongan dengan mengasumsikan bahwa semua informasi pada suatu topik ada dalam potongan itu: mereka terbebas dari kesulitan mental karena harus mencari melalui file besar dengan banyak elemen asing.

Tipuan relatif

Dalam Konvensi Pengemasan Terbuka, setiap file yang memiliki referensi memiliki file _rels sendiri dengan daftar tipuan. Ini membuatnya lebih mudah untuk memotong dan menempelkan beberapa informasi dengan semua sumber daya yang terkait dalam beberapa kasus, memberikan pelingkupan nama untuk menghapus kemungkinan bentrok nama di antara file, dan sebagainya.

Joey
sumber
0

Manfaat terbesar adalah Anda bisa mendapatkan data Anda dengan membuka ritsleting file dan menyalin teks dari file xml. Ini dapat dilakukan dengan utilitas zip & editor teks, bahkan jika Anda tidak memiliki salinan Word 2007.

Inilah yang membuat format lebih terbuka daripada format biner yang lebih lama.

Joe Internet
sumber