Existe um comando simples para gerar colunas delimitadas por tabulações?

67

Por exemplo, eu tenho um arquivo (produzido com echo -e "var1\tvar2\t\var3\tvar4" > foo) que é produzido como:

$ cat foo
case    elems   meshing nlsys
uniform 2350    0.076662        2.78
non-conformal   348     0.013332        0.55
scale   318     0.013333        0.44
smarter 504     0.016666        0.64
submodel        360     .009999 0.40
unstruct-quad   640     0.019999        0.80
unstruct-tri    1484    0.01    0.88

Eu preferiria a saída como esta (aqui eu usei vime :set tabstop=14):

case          elems         meshing       nlsys
uniform       2350          0.076662      2.78
non-conformal 348           0.013332      0.55
scale         318           0.013333      0.44
smarter       504           0.016666      0.64
submodel      360           .009999       0.40
unstruct-quad 640           0.019999      0.80
unstruct-tri  1484          0.01          0.88

Posso obter a mesma funcionalidade catse usar $ tabs=15no bash (consulte esta pergunta ). Existe um programa que faça esse tipo de formatação automaticamente? Não quero experimentar o tabsvalor antes de catinserir um arquivo.

Sebastian
fonte

Respostas:

87

Eu normalmente uso o columnprograma para isso, está em um pacote chamado bsdmainutilsDebian:

column -t foo

Resultado:

case           elems  meshing   nlsys
uniform        2350   0.076662  2.78
non-conformal  348    0.013332  0.55
scale          318    0.013333  0.44
smarter        504    0.016666  0.64
submodel       360    .009999   0.40
unstruct-quad  640    0.019999  0.80
unstruct-tri   1484   0.01      0.88

Trecho do column(1)meu sistema:

...

-t      Determine the number of columns the input contains and create a
        table.  Columns are delimited with whitespace, by default, or
        with the characters supplied using the -s option.  Useful for
        pretty-printing displays.

...
Thor
fonte
ótimo! Muito obrigado! Ele já estava instalado na minha máquina.
Sebastian
11
convém adicionar o -s $'\t'(não encontrado em todas as implementações de coluna), caso alguns dos campos contenham espaços.
Stéphane Chazelas
2
@RakholiyaJenish $'\t'significa caractere de tabulação. Nova linha é $'\n'e assim por diante.
Manwe
2
Eu usei isso como column -ts: /etc/passwd. Parece legal!
kyb 1/09/18
11
@kyb: parece ainda melhor com -n, ou seja, evitar a fusão de várias delimitadores adjacentes
Thor
10

Várias opções:

var1=uniform var2=2350 var3=0.076662 var4=2.78

printf '%-15s %-10s %-12s %s\n' \
  case elems messing nlsys \
  "$var1" "$var2" "$var3" "$var4"

printf '%s\t%s\t%s\t%s\n' \
  case elems messing nlsys \
  "$var1" "$var2" "$var3" "$var4" |
  expand -t 15,25,37

printf '%s\t%s\t%s\t%s\n' \
  case elems messing nlsys \
  "$var1" "$var2" "$var3" "$var4" |
  column -t -s $'\t'

column é um comando não padrão, algumas implementações / versões não suportam a opção -s. Ele calcula a largura da coluna com base na entrada, mas isso significa que ele só pode começar a ser exibido quando toda a entrada tiver sido alimentada. $'...'A sintaxe ksh93 também é encontrada no zsh e no bash.

Com zsh:

values=(
  case elems messing nlsys
  "$var1" "$var2" "$var3" "$var4"
)
print -arC4 -- "$values[@]"
Stéphane Chazelas
fonte
4

Você também pode usar rscomo uma alternativa para column -t:

(x=$(cat);rs -c -z $(wc -l<<<"$x")<<<"$x")

-caltera o separador de colunas de entrada, mas -csozinho define o separador de colunas de entrada para uma guia. -zdefine a largura de cada coluna para a largura da entrada mais longa da coluna em vez de tornar todas as colunas da mesma largura. Se algumas linhas tiverem menos colunas que a primeira, adicione -n.

nisetama
fonte
Qual rsé isso? Não tenho esse comando instalado no meu CentOS nem nos meus sistemas Ubuntu / Mint.
Anthon
11
@Anthon É um comando BSD que também vem com o OS X, nomeado após a função remodelar no APL. O nome do pacote Debian é justo rs, então você pode instalá-lo com apt-get install rs.
Nisetama 6/03/16
você poderia fornecer um exemplo de como alguém chamaria o comando (x=$(cat);rs -c -z $(wc -l<<<"$x")<<<"$x")? Eu não sei como eu iria sobre como usá-lo com um arquivo csv
baxx 13/10
3

Outra ferramenta que pode fazer isso é da TSV Utilitiestsv-pretty do eBay (exoneração de responsabilidade: sou o autor). É necessário o passo adicional de alinhar campos numéricos no ponto decimal. Por exemplo:

$ tsv-pretty foo
case           elems   meshing  nlsys
uniform         2350  0.076662   2.78
non-conformal    348  0.013332   0.55
scale            318  0.013333   0.44
smarter          504  0.016666   0.64
submodel         360   .009999   0.40
unstruct-quad    640  0.019999   0.80
unstruct-tri    1484  0.01       0.88

Existem várias opções de formatação. Por exemplo, -usublinha o cabeçalho e -fformata os flutuadores em um campo da mesma forma para facilitar a leitura:

$ tsv-pretty foo -f -u
case           elems   meshing  nlsys
----           -----   -------  -----
uniform         2350  0.076662   2.78
non-conformal    348  0.013332   0.55
scale            318  0.013333   0.44
smarter          504  0.016666   0.64
submodel         360  0.009999   0.40
unstruct-quad    640  0.019999   0.80
unstruct-tri    1484  0.010000   0.88

Mais informações estão disponíveis na referência tsv-pretty .

JonDeg
fonte
Isso é realmente útil
Arefe
1

A questão era sobre a saída de colunas delimitadas por tabulação.

Portanto, a resposta correta é uma pequena adaptação da resposta de @nisetama. Eu adicionei a opção -C $ '\ t' que define a formatação da saída.

x=$(cat foo2); rs -C$'\t' $(wc -l <<<"$x") <<<"$x"

Kudo's para @nisetama though :)

thehpi
fonte
1
function printTable()
{
    local -r delimiter="${1}"
    local -r data="$(removeEmptyLines "${2}")"

    if [[ "${delimiter}" != '' && "$(isEmptyString "${data}")" = 'false' ]]
    then
        local -r numberOfLines="$(wc -l <<< "${data}")"

        if [[ "${numberOfLines}" -gt '0' ]]
        then
            local table=''
            local i=1

            for ((i = 1; i <= "${numberOfLines}"; i = i + 1))
            do
                local line=''
                line="$(sed "${i}q;d" <<< "${data}")"

                local numberOfColumns='0'
                numberOfColumns="$(awk -F "${delimiter}" '{print NF}' <<< "${line}")"

                # Add Line Delimiter

                if [[ "${i}" -eq '1' ]]
                then
                    table="${table}$(printf '%s#+' "$(repeatString '#+' "${numberOfColumns}")")"
                fi

                # Add Header Or Body

                table="${table}\n"

                local j=1

                for ((j = 1; j <= "${numberOfColumns}"; j = j + 1))
                do
                    table="${table}$(printf '#| %s' "$(cut -d "${delimiter}" -f "${j}" <<< "${line}")")"
                done

                table="${table}#|\n"

                # Add Line Delimiter

                if [[ "${i}" -eq '1' ]] || [[ "${numberOfLines}" -gt '1' && "${i}" -eq "${numberOfLines}" ]]
                then
                    table="${table}$(printf '%s#+' "$(repeatString '#+' "${numberOfColumns}")")"
                fi
            done

            if [[ "$(isEmptyString "${table}")" = 'false' ]]
            then
                echo -e "${table}" | column -s '#' -t | awk '/^\+/{gsub(" ", "-", $0)}1'
            fi
        fi
    fi
}

function removeEmptyLines()
{
    local -r content="${1}"

    echo -e "${content}" | sed '/^\s*$/d'
}

function repeatString()
{
    local -r string="${1}"
    local -r numberToRepeat="${2}"

    if [[ "${string}" != '' && "${numberToRepeat}" =~ ^[1-9][0-9]*$ ]]
    then
        local -r result="$(printf "%${numberToRepeat}s")"
        echo -e "${result// /${string}}"
    fi
}

function isEmptyString()
{
    local -r string="${1}"

    if [[ "$(trimString "${string}")" = '' ]]
    then
        echo 'true' && return 0
    fi

    echo 'false' && return 1
}

function trimString()
{
    local -r string="${1}"

    sed 's,^[[:blank:]]*,,' <<< "${string}" | sed 's,[[:blank:]]*$,,'
}

EXECUÇÃO DE AMOSTRAS

$ cat data-1.txt
HEADER 1,HEADER 2,HEADER 3

$ printTable ',' "$(cat data-1.txt)"
+-----------+-----------+-----------+
| HEADER 1  | HEADER 2  | HEADER 3  |
+-----------+-----------+-----------+

$ cat data-2.txt
HEADER 1,HEADER 2,HEADER 3
data 1,data 2,data 3

$ printTable ',' "$(cat data-2.txt)"
+-----------+-----------+-----------+
| HEADER 1  | HEADER 2  | HEADER 3  |
+-----------+-----------+-----------+
| data 1    | data 2    | data 3    |
+-----------+-----------+-----------+

$ cat data-3.txt
HEADER 1,HEADER 2,HEADER 3
data 1,data 2,data 3
data 4,data 5,data 6

$ printTable ',' "$(cat data-3.txt)"
+-----------+-----------+-----------+
| HEADER 1  | HEADER 2  | HEADER 3  |
+-----------+-----------+-----------+
| data 1    | data 2    | data 3    |
| data 4    | data 5    | data 6    |
+-----------+-----------+-----------+

$ cat data-4.txt
HEADER
data

$ printTable ',' "$(cat data-4.txt)"
+---------+
| HEADER  |
+---------+
| data    |
+---------+

$ cat data-5.txt
HEADER

data 1

data 2

$ printTable ',' "$(cat data-5.txt)"
+---------+
| HEADER  |
+---------+
| data 1  |
| data 2  |
+---------+

REF LIB em: https://github.com/gdbtek/linux-cookbooks/blob/master/libraries/util.bash

Nam Nguyen
fonte
interessante bash-única solução - obrigado por compartilhar
Sebastian
Isso é muito complicado. E não é apenas para o bash, pois existem comandos externos, como sedsendo usados.
precisa saber é o seguinte