"Lihat Sumber" - setara dengan dokumen Word?

11

Kadang-kadang dokumen Word tampaknya kurang lebih pecah, biasanya ketika tata letak sudah cukup kompleks dan dokumen telah berpindah tangan dan / atau versi beberapa kali. Gejala mungkin tidak terjadi apa-apa saat menekan tombol Backspaceatau Enterdi lokasi tertentu dari dokumen yang benar-benar berfungsi, atau bahwa pemformatan tampaknya berlaku dan reset sendiri kurang lebih secara acak. Saya pikir kita semua pernah ke sana.

Seringkali bisa sangat sulit untuk mengetahui apa yang salah, karena apa yang terjadi di balik tudung kata di Word cukup buram. Anda dapat memiliki dokumen yang terlihat kosong, tetapi dalam kenyataannya keadaan mendasar tentang pemformatan dll bisa sangat rumit.

Dalam kasus ini, akan bermanfaat untuk mengintip kode sumber di balik apa yang ditampilkan pada halaman; seperti bagaimana Anda di browser dapat melakukan Lihat Sumber , dan idealnya dapat melakukan pengeditan langsung dalam kode sumber, seperti bagaimana Anda akan lakukan ketika menggunakan Lateks. Apakah ada perintah atau utilitas tipe Lihat Sumber untuk dokumen Microsoft Word?

Dugaan saya adalah bahwa tidak ada perintah seperti itu, atau saya akan pernah mendengarnya. Jika itu masalahnya, apakah ada yang punya pendekatan yang baik ketika datang untuk menguasai "format tersembunyi" yang menjengkelkan dalam dokumen Word ?

Saya menduga mungkin ada beberapa perbedaan dalam format .doc dan .docx; Saya tertarik pada kedua kasus tersebut.

Astaga
sumber

Jawaban:

11

Jika memformat adalah yang paling Anda minati maka Word memang memiliki kemampuan yang bagus untuk memeriksa semua jenis pemformatan yang diterapkan pada teks dan objek yang disebut Reveal Formatting . Di Word 2007 dan 2010 pintasan untuk panel ini adalah Shift+ F1.

masukkan deskripsi gambar di sini

Kalau tidak, jika Anda mencari pemahaman yang lebih dalam tentang format dokumen maka Anda dapat melihat XML untuk file DOCX.

  1. Temukan dokumen DOCX Anda pada disk.
  2. Ubah ekstensi dokumen dari .docx ke .zip.
  3. Klik dua kali pada file dan buka di manajer arsip default.
  4. Arahkan ke folder "Word" di program zip dan buka Document.xml . Ini adalah kode di balik apa yang membuat sebagian besar konten dokumen, meskipun file lain juga digunakan dengan cara lain yaitu untuk gaya atau informasi font.

Anda pasti akan membutuhkan editor XML yang layak hanya untuk melihat data dan bahkan itu cukup kompleks dan untuk dokumen besar akan sangat lama.

Ketika datang ke DOC tidak ada cara mudah untuk "melihat sumber" karena ini adalah file biner yang terdiri dari aliran terpisah dan oleh karena itu tidak ada cara mudah untuk melihat konten.

Adam
sumber
Itu cukup berguna, saya tidak tahu itu. Sayang sekali Anda tidak dapat melakukan hal yang sama untuk file .doc, karena itulah yang masih digunakan perusahaan saya. Terima kasih atas penjelasannya!
Godsmith
1
@Godsmith Anda dapat menyimpan DOC sebagai DOCX menggunakan versi Word yang lebih baru, lalu kembali ke DOC setelah Anda melakukan perubahan apa pun. Ada kehilangan format dalam proses ini, jadi berhati-hatilah tetapi Anda mungkin menemukan Anda dapat membuat perubahan atau memperbaiki masalah pada tipe DOC Anda dengan melakukannya di DOCX.
ThisClark
Anda juga dapat menyimpan file apa pun secara langsung sebagai html di MS Word. Atau Anda dapat menyimpan sebagai RTF dan membuka file RTF sebagai teks
phuclv
3

Saya kira format .doc cukup sulit, jadi saya tidak dapat membantu Anda di sini. Namun, .docx sebenarnya adalah file zip dengan semua detail yang tersimpan dalam file XML. Jadi, ganti nama file menjadi .zip dan lihat sumbernya!

Peter Albert
sumber
0

Ketika datang ke format biner seperti * .doc maka semuanya lebih rumit. Anda dapat menggunakan mso-dumper LibreOffice . Cukup tirukan solusi ke mesin lokal Anda dan jalankan

python doc-dump.py \path\to\file.doc >output.xml

Sekarang semua hal dalam file biner akan dikonversi ke xml dalam format yang tepat yang dijelaskan dalam Word (.doc) Binary File Format

Ada juga WordFileDump yang lebih sederhana tetapi tidak sekuat mso-dumper

Sayangnya itu hanya untuk menganalisis struktur dan tidak ada alat untuk memasang kembali output xml kembali ke file * .doc, jadi setelah Anda menemukan menemukan penyebab root Anda harus menggunakan Word untuk mengeditnya. Oleh karena itu akan lebih mudah untuk dikonversi ke * .docx, periksa file * .docx kemudian konversikan kembali ke * .doc jika perlu

Atau Anda juga dapat menyimpan file sebagai rtf yang merupakan file teks "yang dapat dibaca manusia" alih-alih kantor xml. Atau simpan file kata sebagai html

phuclv
sumber