Utilitas dump hex reversibel (alias `xxd`)

12

xxdadalah utilitas, yang dibundel dengan vim, yang telah digunakan untuk menyandikan jawaban untuk masalah kode golf di situs ini. Itu mengkonversi file biner menjadi hex dump dan kembali lagi.

Terapkan xxddan xxd -rperintah dalam bahasa pemrograman pilihan Anda. Penilaian didasarkan pada karakter / byte panjang a) program Anda dan b) setiap argumen baris perintah yang diperlukan untuk mengganti program gabungan antar mode (tidak perlu -r). Seperti dalam golf, skor yang lebih rendah lebih baik.

  • Untuk dua program terpisah: kode maju + kode terbalik
  • Untuk program gabungan: kode gabungan + jumlah ( argumen maju ) + jumlah ( argumen terbalik ) - 2

Spesifikasi xxdhimpunan bagian yang dipilih

Perintah penerusan ( mis. xxd ) Menerima 0 ≤ n ≤ 2 16 byte dari input standar dan menghasilkan garis ceil ( n / 16) dari output standar dalam format berikut (semua huruf kecil hex digit):

  • Offset byte yang disandikan pertama (format string "%07x:"); berakhir di"0"
  • Paling banyak 16 byte hex-encoded, dikelompokkan menjadi berpasangan (format string " %02x"untuk even byte, "%02x"untuk byte aneh) dan berlapis kanan dengan spasi hingga 42 karakter
  • Byte yang disandikan diartikan sebagai karakter ASCII, nilainya tidak antara 0x20 dan 0x7e ( '\40'dan '\176') inklusif menjadi"."
  • Baris baru ("\n" ; "\r\n"diizinkan ketika output standar dalam mode biner)

Implementasi C ungolfed C minimal:

#include <stdio.h>
int main() {
    unsigned char L[16];
    int t = 0, n, i, s;

    for (; (n = fread(L, 1, 16, stdin)); t += n) {
        printf("%07x:", t);
        s = 42;
        for (i = 0; i < n; i++)
            s -= printf(i & 1 ? "%02x" : " %02x", L[i]);
        printf("%*s", s, "");
        for (i = 0; i < n; i++)
            putchar(L[i] > '\37' && L[i] < '\177' ? L[i] : '.');
        printf("\n");
    }

    return 0;
}

Perintah kebalikan ( mis. xxd -r ) Menerima output yang tidak dimodifikasi dari perintah penerusan (diberikan input yang valid untuk perintah itu) dan menghasilkan input asli.

Contoh penggunaan

$ xxd < /dev/null | wc -c
0
$ php -r 'echo join(range("\0",~"\0"));' | xxd
0000000: 0001 0203 0405 0607 0809 0a0b 0c0d 0e0f  ................
0000010: 1011 1213 1415 1617 1819 1a1b 1c1d 1e1f  ................
0000020: 2021 2223 2425 2627 2829 2a2b 2c2d 2e2f   !"#$%&'()*+,-./
0000030: 3031 3233 3435 3637 3839 3a3b 3c3d 3e3f  0123456789:;<=>?
0000040: 4041 4243 4445 4647 4849 4a4b 4c4d 4e4f  @ABCDEFGHIJKLMNO
0000050: 5051 5253 5455 5657 5859 5a5b 5c5d 5e5f  PQRSTUVWXYZ[\]^_
0000060: 6061 6263 6465 6667 6869 6a6b 6c6d 6e6f  `abcdefghijklmno
0000070: 7071 7273 7475 7677 7879 7a7b 7c7d 7e7f  pqrstuvwxyz{|}~.
0000080: 8081 8283 8485 8687 8889 8a8b 8c8d 8e8f  ................
0000090: 9091 9293 9495 9697 9899 9a9b 9c9d 9e9f  ................
00000a0: a0a1 a2a3 a4a5 a6a7 a8a9 aaab acad aeaf  ................
00000b0: b0b1 b2b3 b4b5 b6b7 b8b9 babb bcbd bebf  ................
00000c0: c0c1 c2c3 c4c5 c6c7 c8c9 cacb cccd cecf  ................
00000d0: d0d1 d2d3 d4d5 d6d7 d8d9 dadb dcdd dedf  ................
00000e0: e0e1 e2e3 e4e5 e6e7 e8e9 eaeb eced eeef  ................
00000f0: f0f1 f2f3 f4f5 f6f7 f8f9 fafb fcfd feff  ................
$ xxd <<< 'The quick brown fox jumps over the lazy dog.'
0000000: 5468 6520 7175 6963 6b20 6272 6f77 6e20  The quick brown 
0000010: 666f 7820 6a75 6d70 7320 6f76 6572 2074  fox jumps over t
0000020: 6865 206c 617a 7920 646f 672e 0a         he lazy dog..
$ xxd <<< 'The quick brown fox jumps over the lazy dog.' | xxd -r
The quick brown fox jumps over the lazy dog.
Tolong berdiri
sumber
Haruskah mode sebaliknya mengabaikan karakter ASCII yang salah? (FWIW sebenarnya xxd, yang cukup berguna).
Peter Taylor
@PeterTaylor: Mode sebaliknya hanya harus bekerja dengan baik dengan dump hex yang tidak dimodifikasi (mulai dari 0000000, digit hex huruf kecil, 16 byte di semua lini tetapi yang terakhir, tanpa celah, dll. ), Dan validasi input tidak diperlukan. Yang mengatakan, mungkin masuk akal untuk mengabaikan kolom 16-karakter "ASCII" di sebelah kanan, karena tidak dapat digunakan untuk membedakan "." dan karakter yang tidak dapat dicetak.
PleaseStand

Jawaban:

3

Perl, 122 + 54 = 176 122 + 45 = 167

Skrip maju:

$/=$,;for(<>=~/.{1,16}/gs){$h="";$h.=sprintf"%*s%02x",++$m%2,"",ord for/./gs;
s/[^ -~]/./g;printf"%06x0:%-42s",$n++,$h;say}

Dan skrip terbalik:

/:(.+?)  /,print map{chr hex}$1=~/\w\w/gfor<>

(Yang ini menarik; ada semua jenis bug tidak jelas yang dapat muncul di skrip terbalik tergantung pada input, jika Anda tidak hati-hati.)

kotak roti
sumber
Karena $1diketahui hanya mengandung digit hex dan spasi, tidak bisakah Anda menggunakan /\w\w/bukan /[0-9a-f]{2}/?
Neil
$1mengandung banyak hal selain angka hex dan spasi.
kotak roti
Dalam contoh, saya hanya melihat angka hex dan spasi antara : dan ``.
Neil
(Adakah yang tahu cara menghasilkan dua ruang monospace dalam penurunan harga komentar?)
Neil
@Neil Sudahlah, saya salah membaca kode saya sendiri. Saya tidak ingat sekarang mengapa saya tidak hanya menggunakan /\w\w/. Tampaknya begitu jelas sehingga saya merasa harus memiliki alasan, tetapi saya tidak dapat melihatnya. Dugaan terbaik saya adalah bahwa itu adalah peninggalan dari versi yang mencoba untuk menghindari memerlukan regex awal.
kotak roti