#Dicas LPI 103.2 – Processar fluxos de texto com o uso de filtros

Share

Prosseguindo nos objetivos da Certificação LPI, iremos hoje apresentar os comandos fornecidos pelo pacote “GNU textutils” para realização de atividades de recortar, extrair e filtrar conteúdos em arquivos.

O Linux têm diversas ferramentas para trabalhar e transformar arquivos textos puros, sem formatação especial. Estas ferramentas são úteis quando estamos trabalhando com scripts no shell, verificando arquivos de log, e etc.

Vamos aos comandos:

cat

Utilizado para visualizar conteúdo, podendo ser utilizado como redirecionador, tomando todo o conteúdo direcionado para sua entrada padrão e enviando para sua saída padrão.

Exemplo, para criar um arquivo com apenas algumas linhas de texto:

# cat > teste.txt

tac

Tem função semelhante ao do cat, entretanto, mostra o conteúdo de trás para frente.

# tac arquivo.txt

head

Mostra o começo de arquivos. Por padrão, as primeiras linhas são mostradas. A quantidade de linhas a serem mostradas é indicada pela opção -n. A opção -c especifica o número de caracteres (bytes) a serem mostrados.

# head -n 50 LEIAME.TXT

tail

O comando tail visualiza as 10 últimas de um arquivo. Funciona como oposto do head.

# tail -n 50 /var/log/syslog

# tail -f /var/log/dmesg

wc

O comando wc conta as linhas, palavras e caracteres de um ou mais arquivos. Se mais de um arquivo foi passado como argumento, ele irá apresentar as estatísticas de cada arquivo e também o total.

# wc LEIAME.TXT

nl

O comando nl é utilizado para numerar as linhas de um arquivo. O comando considera condições especiais para o cabeçalho e o rodapé do arquivo.

 # nl arquivo.txt

expand

Substitui espaços de tabulação (TAB’s) pos espaços simples, mantendo a mesma distância aparente.

unexpand

Substitui dois ou mais espaços simples, em um texto, por espaços de tabulação (TAB).

hexdump

Mostra arquivos binários. A opção -C torna a saída mais legível, mostrando a coluna de endereço hexadecimal, seguida pela  coluna dos dados do arquivo (valores hexadecimais sequenciais separados a cada dois bytes) e, por último, pela coluna que mostra esses mesmos bytes no formato ASCII.

od

O comando od é utilizado  visualizarmos o conteúdo de um arquivo nos formatos hexadecimal, octal, ASCII e nome dos caracteres.

split

O comando split é usado para dividir grandes arquivos em n-arquivos menores. Os arquivos de saída são gerados de acordo com tamanho do arquivo de entrada. O padrão é dividir o arquivo a cada 1000 linhas. Os nomes dos arquivos de saída seguem o padrão arquivosaidaaa arquivosaidaab arquivosaidaac, e assim  por diante.

# split -20 arquivo1.txt arquivosaida.txt

Com isso encerramos essa primeira parte, e no próximo post daremos continuidade ao assunto.

Quer continuar por dentro das novidades do Blog Seja Livre? Siga o nosso perfil no TWITTER, curta a nossa página no FACEBOOK ou adicione o Blog Seja Livre nos seus círculos do GOOGLE+.