Saya memiliki file teks yang sangat panjang (dari sini ) yang harus berisi 6 karakter heksadesimal kemudian 'break' (yang muncul sebagai satu karakter dan tampaknya tidak muncul dengan benar dalam penurunan kode di bawah) diikuti oleh beberapa kata:
00107B Cisco Systems, Inc
00906D Cisco Systems, Inc
0090BF Cisco Systems, Inc
5080 Cisco Systems, Inc
0E+00 ASUSTek COMPUTER INC.
000C6E ASUSTek COMPUTER INC.
001BFC ASUSTek COMPUTER INC.
001E8C ASUSTek COMPUTER INC.
0015F2 ASUSTek COMPUTER INC.
2354 ASUSTek COMPUTER INC.
001FC6 ASUSTek COMPUTER INC.
60182E ShenZhen Protruly Electronic Ltd co.
F4CFE2 Cisco Systems, Inc
501CBF Cisco Systems, Inc
Saya telah melakukan beberapa melihat sekeliling dan tidak dapat melihat sesuatu yang akan berhasil dalam situasi ini. Pertanyaan saya adalah, bagaimana saya bisa menggunakan grep
/ sed
/ awk
/ perl
untuk menghapus semua baris file teks ini yang tidak dimulai dengan tepat 6 karakter heksadesimal dan kemudian 'break'?
PS Untuk poin bonus, apa cara terbaik untuk menyortir file secara alfabet dan numerik sesuai dengan karakter hex (yaitu 000000
-> FFFFFF
)? Haruskah saya gunakan sort
?
Dan untuk kelengkapan, Anda dapat melakukan ini dengan grep juga:
Ekspresi grep yang diperluas ini mencari tepat 6 digit hex pada awal setiap baris, diikuti segera oleh batas non-spasi-putih-ke-spasi putih (
\b
).sumber