Jadi saya punya dump wikipedia ini berukuran sekitar 10gb dan dinamai "enwiki-latest-pages-articles.xml.bz2". Saya telah mencoba perintah berikut di terminal untuk unzip dump:
tar jxf enwiki-latest-pages-articles.xml.bz2
Dan
tar xvf enwiki-latest-pages-articles.xml.bz2
Tetapi keduanya mengembalikan kesalahan berikut
tar: This does not look like a tar archive
tar: Skipping to next header
command-line
tar
bzip2
Arun Mohan
sumber
sumber
7z
util untuk mengekstraksi semuanyaJawaban:
Anda tidak dapat menggunakan
tar
perintah karena arsipnya bukan file .tar. *. Untuk membuka kompresi file bzip2, gunakan perintah berikut (ini tidak akan mempertahankan file .bz2 asli):Jika Anda ingin mengekstraknya dan menyimpan yang asli, jalankan perintah ini:
Sumber: https://superuser.com/questions/480950/how-to-decompress-a-bz2-file
sumber
bunzip2
.Cukup gunakan
bunzip2
:Dan jika ini adalah
gzip
file yang ditekan:sumber