<font color='#FF0000'> and </font>
사이에 텍스트 정보를 추출하는 데 사용하려는 다음 코드가 있습니다. 그것은 잘 작동하지만 그것은 단지 하나의 단위 (첫 번째)를 추출하는 반면 나는이 태그 사이의 모든 텍스트 단위를 추출하고 싶습니다. 나는 bash 루프 코드로 이것을 시도했지만 작동하지 않았다.Python으로 텍스트 추출 반복
import os
directory_path ='C:\\My_folder\\tmp'
for files in os.listdir(directory_path):
print(files)
path_for_files = os.path.join(directory_path, files)
text = open(path_for_files, mode='r', encoding='utf-8').read()
starting_tag = '<font color='
ending_tag = '</font>'
ground = text[text.find(starting_tag):text.find(ending_tag)]
results_dir = 'C:\\My_folder\\tmp'
results_file = files[:-4] + 'txt'
path_for_files = os.path.join(results_dir, results_file)
open(path_for_files, mode='w', encoding='UTF-8').write(result)
는 내가 모든 하나 이상을 원하는 경우 find_all 같은 것을 사용해야합니다 상상. –