Bagaimana cara mengubah file Webarchive Safari menjadi folder?

16

Saya mengerti bahwa webarchive Safari adalah file tunggal dengan kode sumber dan sumber daya lainnya dari halaman web yang digabungkan menjadi satu file. Saya menemukan artikel Macworld dari 2006 yang menjelaskan program yang melakukan hal ini, tetapi tautan ke program tersebut tidak lagi terkini.

Apakah ada perangkat lunak yang tersedia saat ini yang dapat mengkonversi file webarchive Safari ke format yang lebih standar?

Daniel
sumber

Jawaban:

7

WebArchiveExtractor

Saya merekomendasikan WebArchiveExtractor. Anda dapat menyeret file .webarchive ke aplikasi ini yang akan mengekstrak file tersebut ke file individualnya di folder.

Anda dapat menyesuaikan output di Preferensi, termasuk mengatur nama file indeks kustom:

WebArchiveExtractor adalah sumber terbuka di GitHub

GRG
sumber
WebArchive Extractor tidak berfungsi untuk saya pada 9 Des 2019. Saya menggunakan macOS 10.14.4 (18E226) Mojave pada file .webarchive dari Safari.
Merchako
11

Apakah ada perangkat lunak yang tersedia saat ini yang dapat mengkonversi file webarchive Safari ke format yang lebih standar?

Jika Anda merasa nyaman dengan baris perintah, ada alat textutildi Mac OS untuk mengubah file webarchive menjadi txt, html, rtf, rtfd, doc, docx, wordml, atau odt.

Contoh:
textutil -convert html /Users/USERNAME/NAME.webarchive


Untuk mengonversi file webarchive ke pdf, coba "Wondershare PDF Editor for Mac". http://www.wondershare.com/pdf/how-to-convert-webarchive-to-pdf.html

Ivan Chau
sumber
4
The textutiltool baris perintah hanya ekstrak file html tingkat atas, dan bukan CSS atau script yang juga merupakan bagian dari webarchive tersebut. (Yang benar-benar inti dari webarchive.) Saya belum menemukan cara alternatif yang baik untuk melakukan ini dari baris perintah.
Stephen Harrison
1
@Stephen WebArchiveExtractor memiliki tindakan Automator yang dapat dituliskan melalui shell.
grg
Terlepas dari peringatan, itu adalah jawaban yang saya cari. Solusi berbasis GUI sangat tidak berguna ketika Anda ingin mengonversi ratusan webarchives di server.
Tujuh
Ini bahkan tidak mengekstrak file HTML asli, tetapi mengubahnya. Ini lebih seperti membuka file HTML di TextEdit dan mengekspornya kembali.
sam