Kadang-kadang dokumen Word tampaknya kurang lebih pecah, biasanya ketika tata letak sudah cukup kompleks dan dokumen telah berpindah tangan dan / atau versi beberapa kali. Gejala mungkin tidak terjadi apa-apa saat menekan tombol Backspaceatau Enterdi lokasi tertentu dari dokumen yang benar-benar berfungsi, atau bahwa pemformatan tampaknya berlaku dan reset sendiri kurang lebih secara acak. Saya pikir kita semua pernah ke sana.
Seringkali bisa sangat sulit untuk mengetahui apa yang salah, karena apa yang terjadi di balik tudung kata di Word cukup buram. Anda dapat memiliki dokumen yang terlihat kosong, tetapi dalam kenyataannya keadaan mendasar tentang pemformatan dll bisa sangat rumit.
Dalam kasus ini, akan bermanfaat untuk mengintip kode sumber di balik apa yang ditampilkan pada halaman; seperti bagaimana Anda di browser dapat melakukan Lihat Sumber , dan idealnya dapat melakukan pengeditan langsung dalam kode sumber, seperti bagaimana Anda akan lakukan ketika menggunakan Lateks. Apakah ada perintah atau utilitas tipe Lihat Sumber untuk dokumen Microsoft Word?
Dugaan saya adalah bahwa tidak ada perintah seperti itu, atau saya akan pernah mendengarnya. Jika itu masalahnya, apakah ada yang punya pendekatan yang baik ketika datang untuk menguasai "format tersembunyi" yang menjengkelkan dalam dokumen Word ?
Saya menduga mungkin ada beberapa perbedaan dalam format .doc dan .docx; Saya tertarik pada kedua kasus tersebut.
sumber
Saya kira format .doc cukup sulit, jadi saya tidak dapat membantu Anda di sini. Namun, .docx sebenarnya adalah file zip dengan semua detail yang tersimpan dalam file XML. Jadi, ganti nama file menjadi .zip dan lihat sumbernya!
sumber
Ketika datang ke format biner seperti * .doc maka semuanya lebih rumit. Anda dapat menggunakan mso-dumper LibreOffice . Cukup tirukan solusi ke mesin lokal Anda dan jalankan
Sekarang semua hal dalam file biner akan dikonversi ke xml dalam format yang tepat yang dijelaskan dalam Word (.doc) Binary File Format
Ada juga WordFileDump yang lebih sederhana tetapi tidak sekuat mso-dumper
Sayangnya itu hanya untuk menganalisis struktur dan tidak ada alat untuk memasang kembali output xml kembali ke file * .doc, jadi setelah Anda menemukan menemukan penyebab root Anda harus menggunakan Word untuk mengeditnya. Oleh karena itu akan lebih mudah untuk dikonversi ke * .docx, periksa file * .docx kemudian konversikan kembali ke * .doc jika perlu
Atau Anda juga dapat menyimpan file sebagai rtf yang merupakan file teks "yang dapat dibaca manusia" alih-alih kantor xml. Atau simpan file kata sebagai html
sumber