Saya sedang wget
file besar (lebih dari 100GB) dan kemudian membandingkan md5sum saya dengan jumlah yang diposting di repositori. Percaya atau tidak, md5sum
perlu waktu tidak berjalan untuk menjalankan file sebesar ini, jadi saya ingin mendapatkan jumlah secara paralel dengan unduhan.
Apa cara terbaik untuk melakukan ini? Saya tidak melihat wget
opsi untuk menghitung MD5 selama pengunduhan (mengejutkan) jadi saya kira menggunakan tee
akan menjadi cara untuk pergi ?!
Jawaban:
Sebenarnya, ini dimungkinkan:
Namun, ini mengasumsikan Anda memiliki hash dalam file sebelumnya.
sumber
md5sum
(dan algoritma hash umum lainnya seperti keluarga SHA) beroperasi dalam memori konstan. Mereka dirancang untuk bekerja di stream.awk
di akhir Anda dapat menghapus a-a secara otomatis.wget -O - "https://example.org/myFile.jpg" | tee file | md5sum | awk '{print $1}' > md5.txt