/tmp/data/$ yearmonth/$ day/$ hour와 같은 디렉토리 구조에서 매일 일부 tsv 파일을 수집합니다. 따라서/tmp를/데이터/$의 월 (1 년 기준)/$ 일파일 배열에서 cat을 읽는 중
의 내부 24 디렉토리 내가 쉘 스크립트 같이 가지고있다 :
yearmonth=`date -d "-2 days" +%Y%m`
day=`date -d "-2 days" +%d`
files=()
cd /tmp/data/$yearmonth/$day
for i in `ls -a */*.tsv`
do
files+=($i)
done
배열 파일이있다 그 안에 저장된 모든 TSV 파일. 이 모든 tsvfiles를 하나의 단일 tsvfiles에 "cat"하고 sort | uniq -c를 수행하려고합니다. 어떻게하면됩니까? tsv 파일이 커지면서 고양이가 매우 느려질 수 있습니다. 다른 대안이 무엇이 될 수 있습니다. 감사
'고양이'에 대해 느린 점은 무엇입니까? –
tsv 파일이 너무 커서 고양이 작업이 매우 느립니다. – user1189851
코드를 모두 표시 할 수 있습니까? –