두 개의 열이있는 데이터 목록에서 고유하고 중복 된 데이터를 찾으려고합니다. 나는 정말 (탭으로 구분)과 같을 수 있습니다 열에서 1"sort -f | uniq -i"명령을 함께 사용하여 대소 문자를 무시합니다.
데이터를 데이터를 비교하려면 :
What are you doing? Che cosa stai facendo?
WHAT ARE YOU DOING? Che diavolo stai facendo?
what are you doing? Qual è il tuo problema amico?
그래서 나는 주변에 연주 된 다음
-
(그냥 "종류", 아니 -f 옵션)의 경우
을 무시하지 않고이 나에게주는 작은 중복
; print $ 1} 'EN-IT_Corpus.txt | 정렬 | UNIQ -i -D>가
둔한 '{FS = \ "를 t"를 내게 준다 이상의 중복 ("정렬 -f') 경우를 무시하여 정리
속는; print $ 1} 'EN-IT_Corpus.txt | sort -f | UNIQ는 -i -D>는
둔한 '{FS는 = "\ T는"정렬
내가 잘 # 2는 그것이 첫 번째 경우를 무시 정렬 때문에이 사건을 무시하고 중복을 찾으려면 더 정확하다고 생각하는 건가요 속는 후 정렬 된 데이터를 기반으로 중복 발견 ?
sort는 중복 표시 옵션이 없기 때문에 정렬과 고유 명령을 결합 할 수 없습니다.
감사합니다, 스티브
를 복제 무엇입니까 샘플 데이터에서 원하는 출력? –