2016-12-20 2 views
1

나는 saprql 쿼리를 사용하여 wikipedia에서 다운로드 한 텍스트 파일을 열어서 처리하려고합니다. 나는 다음과 같은 코드를 사용Python이 디렉토리를 통과하여 txt 파일을 엽니 다.

list_words=[] 
for roots, dirs, files in os.walk(path): 
    for file in files: 
     if file.endswith(".txt"): 
      with open(file, 'r') as f: 
       content= f.read() 

       #remove the punct 
       table=string.maketrans(string.punctuation,' '*len(string.punctuation)) 
       s= content.translate(table) 


       #remove the stopwords 
       text= ' '.join([word for word in s.split() if word not in stopwords]) 
       alfa= " ".join(text.split()) 

       #remove the verbs 
       for word, pos in tag(alfa): # trovo tutti i verbi. 
        if pos != "VB": 
         lower= word.lower() 
         lower_2= unicode(lower, 'utf-8', errors='ignore') 
         list_words.append(lower_2) 

       #remove numbers 
       testo_2 = [item for item in list_words if not item.isdigit()] 

print set(list_words)   

문제는 스크립트가 텍스트 파일을 열고 다른 사람이 나에게 오류 줄 것입니다 : 아무도 알고 있습니까

을 "blablabla.txt 수 없음 같은 파일 또는 디렉터리를" 왜 그런 일이 일어나고 어떻게 대응할 수 있습니까?

감사합니다!

absolute_filename = os.path.join(roots, file) 
with open(absolute_filename, 'r') as f: 
    .... rest of code 

가 (이 대신 rootsroot을 이름을 지정해야합니다) 다음 file이 상대적

+1

파일 경로가 dirpath와 관련된 파일의 이름을 제공합니다. 파일이 작업 디렉토리에 없으면 파일 경로가 발견되지 않습니다. – Natecat

답변

2

, 당신은 루트를 CONCAT과 같은 절대 파일 이름을 얻기 위해 제출해야합니다.

+0

감사합니다. Anthony! – CosimoCD

+0

안녕하세요, 안토니! 귀하의 조치를 따르고 있지만 그것은 나에게 같은 문제가 있음을 발견했습니다. – CosimoCD

+0

안녕하세요! 당신의 조치를 따르지만 같은 문제가 생깁니다 ... IOError : [Errno 2] 그런 파일이나 디렉토리가 없습니다 : 'C : \\ Users \\ Cosimo \\ Desktop \\ Tirocinio \\ progetto_arianna \\ Sintesi H2O_txt \ \ sintesi_txt \\ 1000testi \\ Andrej Aleksandrovic Mironov.txt – CosimoCD