Eu conheço du -sh
sistemas de arquivos Linux comuns. Mas como fazer isso com HDFS?
hadoop
command-line
directory
hdfs
Cheng
fonte
fonte
hadoop fs -du -s -h /path/to/dir
exibe o tamanho de um diretório em formato legível.fonte
hdfs -du -s -h /path/to/dir
é mais apropriado.Estendendo para Matt D e outras respostas, o comando pode ser até Apache Hadoop 3.0.0
O du retorna três colunas com o seguinte formato:
Comando de exemplo:
Código de saída: Retorna 0 em caso de sucesso e -1 em caso de erro.
fonte: Apache doc
fonte
Com isso você obterá o tamanho em GB
fonte
Ao tentar calcular o total de um determinado grupo de arquivos em um diretório, a
-s
opção não funciona (no Hadoop 2.7.1). Por exemplo:Estrutura do diretório:
Suponha que cada arquivo tenha 1 KB de tamanho. Você pode resumir todo o diretório com:
No entanto, se eu quiser a soma de todos os arquivos contendo "contagem", o comando falha.
Para contornar isso, geralmente passo a saída por meio do awk.
fonte
Para obter o tamanho do diretório hdfs dfs -du -s -h / $ yourDirectoryName pode ser usado. hdfs dfsadmin -report pode ser usado para ver um relatório rápido de armazenamento em nível de cluster.
fonte
% de espaço usado no cluster Hadoop
sudo -u hdfs hadoop fs –df
Capacidade sob pasta específica:
sudo -u hdfs hadoop fs -du -h /user
fonte
hadoop fs -du -h /user
(nãosudo
sudo
não é necessário e deve ser usado com moderação.hadoop versão 2.3.33:
fonte
hdfs dfs -count <dir>
informações da página de manual:
fonte
O comando deve ser
hadoop fs -du -s -h \dirPath
-du [-s] [-h] ...: Mostra a quantidade de espaço, em bytes, usada pelos arquivos que correspondem ao padrão de arquivo especificado.
-s : Em vez de mostrar o tamanho de cada arquivo individual que corresponde ao
padrão, mostra o tamanho total (resumo).
-h : formata o tamanho dos arquivos de forma legível, em vez de um número de bytes. (Ex MB / GB / TB etc)
Observe que, mesmo sem a opção -s, isso só mostra resumos de tamanho em um nível de profundidade em um diretório.
A saída está no nome do tamanho do formulário (caminho completo)
fonte