내가 스캔하고자하는 구조화 된 파트와 (스캔하고 싶지 않은) 비 구조화 된 파트가있는 수백 또는 GB의 데이터가있는 디렉토리를 스캔해야합니다.Python os.walk 복잡한 디렉토리 기준
os.walk 함수를 읽어 보면 집합에서 일련의 기준을 사용하여 특정 디렉토리 이름이나 패턴을 제외하거나 포함 할 수 있습니다. 두 개의 유용한 디렉토리, '디렉터리 A'와 '디렉터리가 상상 루트 디렉토리에서
: 내가 예를 들어, 디렉토리에 특정 레벨 당 기준을 포함 / 제외 추가해야이 특정 스캔
B '및 유용하지 않은 휴지통 디렉토리'휴지통 '으로 구분됩니다. Dir A에는 'Subdir A1'과 'Subdir A2'라는 유용한 하위 디렉토리와 유용하지 않은 'SubdirA Trash'디렉토리가 있습니다. 그런 다음 Dir B에는 유용한 Subdir B1과 Subdir B2와 함께 유용한 'SubdirB Trash' 하위 디렉토리. 같은 같습니다
내가, 각 레벨에 대한 특정 기준 목록이이 같은 필요
level1DirectoryCriteria = 세트 ("디렉터리 A"를, "디렉터리 B")
level2DirectoryCriteria = 세트 ("하위 디렉터리 A1", "하위 디렉터리 A2", "하위 디렉터리 B1", "B2 서브 디렉토리")
내가 이것을 수행 할 수있는 유일한 방법은 많은 변수와 불안정성의 높은 위험성을 가진 복잡하고 긴 코드를 사용하는 것은 분명히 비 pyonic입니다. 누구든지이 문제를 해결하는 방법에 대한 아이디어가 있습니까? 성공하면 한 번에 몇 시간 씩 코드 실행 시간을 절약 할 수 있습니다.
이 보인다 :
현재 위치 찾기() 메소드에 대한 자세한 정보를 찾을 수 있습니다. – user3535074
해결책은 여기에서 왔습니다! – user3535074