같은 행에 대해 7 개의 다른 파일을 비교하고 여러 파일에있는 항목을 표시하려고합니다. 이미 이런 일이탭으로 구분 된 파일 7 개를 비교하여 유사점 인쇄
file1 and file2 and file3: ID123
file2 and file3: ID999, ID123
:
with open('some_file_1.txt', 'r') as file1:
with open('some_file_2.txt', 'r') as file2:
same = set(file1).intersection(file2)
same.discard('\n')
with open('some_output_file.txt', 'w') as file_out:
for line in same:
file_out.write(line)
을하지만,이 경우 내가 7을 비교하려면 예를 들어
file1:
ID123 columns with info
ID456 columns with info
ID789 columns with info
file 2:
ID123 columns with info
ID999 columns with info
ID888 columns with info
file3:
ID999 columns with info
ID123 columns with info
ID555 columns with info
는 내가 좋아하는 유사한/쇼 뭔가를 인쇄 할 파일. 또한 탭으로 구분 된 파일이므로 각 파일의 첫 번째 열을 서로 비교하고 중복 된 내용을 기록하고 싶습니다. 나는 내가 필요하다고 생각한다.
for i in excelList[1:]:
newlist = newlist.append(i.split("\t")[0])
또는 그런 무엇인가. 7 개의 목록을 만들더라도 ".intersection"코드로 서로 비교할 수는 없습니다.
더 쉬운 방법이 있나요?
대부분 관련이 없지만 대신 stdlib의 csv 모듈을 사용하는 것이 좋습니다. csv를 구문 분석하는 것은 seprator에서 분할하는 것보다 훨씬 까다로운 작업 일 수 있습니다. –