Apakah ada perintah sederhana untuk menghasilkan kolom yang dibatasi-tab?

67

Misalnya saya punya file (diproduksi dengan echo -e "var1\tvar2\t\var3\tvar4" > foo) yang di-output sebagai:

$ cat foo
case    elems   meshing nlsys
uniform 2350    0.076662        2.78
non-conformal   348     0.013332        0.55
scale   318     0.013333        0.44
smarter 504     0.016666        0.64
submodel        360     .009999 0.40
unstruct-quad   640     0.019999        0.80
unstruct-tri    1484    0.01    0.88

Saya lebih suka output seperti ini (di sini saya menggunakan vimdan :set tabstop=14):

case          elems         meshing       nlsys
uniform       2350          0.076662      2.78
non-conformal 348           0.013332      0.55
scale         318           0.013333      0.44
smarter       504           0.016666      0.64
submodel      360           .009999       0.40
unstruct-quad 640           0.019999      0.80
unstruct-tri  1484          0.01          0.88

Saya bisa mendapatkan fungsionalitas yang sama dengan catjika saya gunakan $ tabs=15di bash (lihat pertanyaan ini ). Apakah ada program yang melakukan pemformatan seperti ini secara otomatis? Saya tidak ingin bereksperimen dengan tabsnilai sebelum catmemasukkan file.

Sebastian
sumber

Jawaban:

87

Saya biasanya menggunakan columnprogram untuk ini, itu dalam sebuah paket bernama bsdmainutilsDebian:

column -t foo

Keluaran:

case           elems  meshing   nlsys
uniform        2350   0.076662  2.78
non-conformal  348    0.013332  0.55
scale          318    0.013333  0.44
smarter        504    0.016666  0.64
submodel       360    .009999   0.40
unstruct-quad  640    0.019999  0.80
unstruct-tri   1484   0.01      0.88

Kutipan dari column(1)pada sistem saya:

...

-t      Determine the number of columns the input contains and create a
        table.  Columns are delimited with whitespace, by default, or
        with the characters supplied using the -s option.  Useful for
        pretty-printing displays.

...
Thor
sumber
Bagus! Terima kasih banyak! Itu sudah diinstal di mesin saya.
Sebastian
11
Anda mungkin ingin menambahkan -s $'\t'(tidak ditemukan di setiap implementasi kolom) kalau-kalau beberapa bidang berisi spasi.
Stéphane Chazelas
2
@RakholiyaJenish $'\t'berarti karakter tab. Baris baru $'\n'dan seterusnya.
Manwe
2
Saya menggunakan ini sebagai column -ts: /etc/passwd. Terlihat keren!
kyb
1
@ Kyb: terlihat lebih baik dengan -n, yaitu menghindari penggabungan beberapa pembatas yang berdekatan
Thor
10

Beberapa pilihan:

var1=uniform var2=2350 var3=0.076662 var4=2.78

printf '%-15s %-10s %-12s %s\n' \
  case elems messing nlsys \
  "$var1" "$var2" "$var3" "$var4"

printf '%s\t%s\t%s\t%s\n' \
  case elems messing nlsys \
  "$var1" "$var2" "$var3" "$var4" |
  expand -t 15,25,37

printf '%s\t%s\t%s\t%s\n' \
  case elems messing nlsys \
  "$var1" "$var2" "$var3" "$var4" |
  column -t -s $'\t'

kolom adalah perintah non-standar, beberapa implementasi / versi tidak mendukung opsi -s. Itu menghitung lebar kolom berdasarkan input, tetapi itu berarti bahwa itu hanya dapat mulai menampilkan setelah semua input diumpankan ke dalamnya. $'...'adalah sintaks ksh93 juga ditemukan di zsh dan bash.

Dengan zsh:

values=(
  case elems messing nlsys
  "$var1" "$var2" "$var3" "$var4"
)
print -arC4 -- "$values[@]"
Stéphane Chazelas
sumber
4

Anda juga dapat menggunakan rssebagai alternatif untuk column -t:

(x=$(cat);rs -c -z $(wc -l<<<"$x")<<<"$x")

-cmengubah pemisah kolom input, tetapi -csendiri yang mengatur pemisah kolom input ke sebuah tab. -zmengatur lebar setiap kolom dengan lebar entri kolom terpanjang alih-alih membuat semua kolom sama lebar. Jika beberapa baris memiliki kolom lebih sedikit daripada baris pertama, tambahkan -n.

nisetama
sumber
Yang mana rsitu? Saya belum menginstal perintah itu pada CentOS saya atau sistem Ubuntu / Mint saya.
Anthon
1
@Anthon Ini adalah perintah BSD yang juga datang dengan OS X, dinamai setelah fungsi membentuk kembali di APL. Nama paket Debian adalah adil rs, sehingga Anda dapat menginstalnya dengan apt-get install rs.
nisetama
dapatkah Anda memberikan contoh bagaimana seseorang akan memanggil perintah (x=$(cat);rs -c -z $(wc -l<<<"$x")<<<"$x")? Saya tidak tahu bagaimana saya akan menggunakannya dengan file csv
baxx
3

Alat lain yang dapat melakukan ini adalah tsv-prettydari TSV Utilities eBay (disclaimer: I'm the author). Dibutuhkan langkah tambahan berbaris bidang numerik pada titik desimal. Sebagai contoh:

$ tsv-pretty foo
case           elems   meshing  nlsys
uniform         2350  0.076662   2.78
non-conformal    348  0.013332   0.55
scale            318  0.013333   0.44
smarter          504  0.016666   0.64
submodel         360   .009999   0.40
unstruct-quad    640  0.019999   0.80
unstruct-tri    1484  0.01       0.88

Ada beberapa opsi pemformatan. Misalnya, -ugaris bawahi tajuk dan -fformat float di bidang yang serupa untuk dibaca:

$ tsv-pretty foo -f -u
case           elems   meshing  nlsys
----           -----   -------  -----
uniform         2350  0.076662   2.78
non-conformal    348  0.013332   0.55
scale            318  0.013333   0.44
smarter          504  0.016666   0.64
submodel         360  0.009999   0.40
unstruct-quad    640  0.019999   0.80
unstruct-tri    1484  0.010000   0.88

Info lebih lanjut tersedia di referensi tsv-pretty .

JonDeg
sumber
Ini sangat membantu
Arefe
1

Pertanyaannya adalah tentang mengeluarkan kolom yang dibatasi tab.

Jadi jawaban yang benar adalah adaptasi kecil dari jawaban @nisetama. Saya menambahkan opsi -C $ '\ t' yang menetapkan pemformatan output.

x=$(cat foo2); rs -C$'\t' $(wc -l <<<"$x") <<<"$x"

Kudo to @nisetama :)

thehpi
sumber
1
function printTable()
{
    local -r delimiter="${1}"
    local -r data="$(removeEmptyLines "${2}")"

    if [[ "${delimiter}" != '' && "$(isEmptyString "${data}")" = 'false' ]]
    then
        local -r numberOfLines="$(wc -l <<< "${data}")"

        if [[ "${numberOfLines}" -gt '0' ]]
        then
            local table=''
            local i=1

            for ((i = 1; i <= "${numberOfLines}"; i = i + 1))
            do
                local line=''
                line="$(sed "${i}q;d" <<< "${data}")"

                local numberOfColumns='0'
                numberOfColumns="$(awk -F "${delimiter}" '{print NF}' <<< "${line}")"

                # Add Line Delimiter

                if [[ "${i}" -eq '1' ]]
                then
                    table="${table}$(printf '%s#+' "$(repeatString '#+' "${numberOfColumns}")")"
                fi

                # Add Header Or Body

                table="${table}\n"

                local j=1

                for ((j = 1; j <= "${numberOfColumns}"; j = j + 1))
                do
                    table="${table}$(printf '#| %s' "$(cut -d "${delimiter}" -f "${j}" <<< "${line}")")"
                done

                table="${table}#|\n"

                # Add Line Delimiter

                if [[ "${i}" -eq '1' ]] || [[ "${numberOfLines}" -gt '1' && "${i}" -eq "${numberOfLines}" ]]
                then
                    table="${table}$(printf '%s#+' "$(repeatString '#+' "${numberOfColumns}")")"
                fi
            done

            if [[ "$(isEmptyString "${table}")" = 'false' ]]
            then
                echo -e "${table}" | column -s '#' -t | awk '/^\+/{gsub(" ", "-", $0)}1'
            fi
        fi
    fi
}

function removeEmptyLines()
{
    local -r content="${1}"

    echo -e "${content}" | sed '/^\s*$/d'
}

function repeatString()
{
    local -r string="${1}"
    local -r numberToRepeat="${2}"

    if [[ "${string}" != '' && "${numberToRepeat}" =~ ^[1-9][0-9]*$ ]]
    then
        local -r result="$(printf "%${numberToRepeat}s")"
        echo -e "${result// /${string}}"
    fi
}

function isEmptyString()
{
    local -r string="${1}"

    if [[ "$(trimString "${string}")" = '' ]]
    then
        echo 'true' && return 0
    fi

    echo 'false' && return 1
}

function trimString()
{
    local -r string="${1}"

    sed 's,^[[:blank:]]*,,' <<< "${string}" | sed 's,[[:blank:]]*$,,'
}

DERET SAMPEL

$ cat data-1.txt
HEADER 1,HEADER 2,HEADER 3

$ printTable ',' "$(cat data-1.txt)"
+-----------+-----------+-----------+
| HEADER 1  | HEADER 2  | HEADER 3  |
+-----------+-----------+-----------+

$ cat data-2.txt
HEADER 1,HEADER 2,HEADER 3
data 1,data 2,data 3

$ printTable ',' "$(cat data-2.txt)"
+-----------+-----------+-----------+
| HEADER 1  | HEADER 2  | HEADER 3  |
+-----------+-----------+-----------+
| data 1    | data 2    | data 3    |
+-----------+-----------+-----------+

$ cat data-3.txt
HEADER 1,HEADER 2,HEADER 3
data 1,data 2,data 3
data 4,data 5,data 6

$ printTable ',' "$(cat data-3.txt)"
+-----------+-----------+-----------+
| HEADER 1  | HEADER 2  | HEADER 3  |
+-----------+-----------+-----------+
| data 1    | data 2    | data 3    |
| data 4    | data 5    | data 6    |
+-----------+-----------+-----------+

$ cat data-4.txt
HEADER
data

$ printTable ',' "$(cat data-4.txt)"
+---------+
| HEADER  |
+---------+
| data    |
+---------+

$ cat data-5.txt
HEADER

data 1

data 2

$ printTable ',' "$(cat data-5.txt)"
+---------+
| HEADER  |
+---------+
| data 1  |
| data 2  |
+---------+

REF LIB di: https://github.com/gdbtek/linux-cookbooks/blob/master/libraries/util.bash

Nam Nguyen
sumber
solusi bash-only yang menarik - terima kasih telah berbagi
Sebastian
Ini terlalu berbelit-belit. Dan ini bukan bash-only karena ada perintah eksternal seperti sedsedang digunakan.
codeforester