2017-11-12 24 views
0

xlrd 라이브러리를 사용하여 Excel 파일에서 값을 파이썬 목록으로 가져옵니다. Excel 파일에 하나의 열이 있고 데이터 행을 현명하게 추출합니다. 는하지만 문제는 내가 목록에 무엇입니까 데이터 내가이 텍스트를 제거하는 방법텍스트 제거 : 파이썬의 문자열에서 u

list = ["text:u'__string__'","text:u'__string__'",.....so on] 

로이다 : u는이에서 문자열 자연의 목록을 얻으려면?

여기

코드 항목에 걸쳐 python2.7에게

book = open_workbook("blabla.xlsx") 
sheet = book.sheet_by_index(0) 
documents = [] 

for row in range(1, 50): #start from 1, to leave out row 0 
    documents.append(sheet.cell(row, 0)) #extract from first col 

data = [str(r) for r in documents] 
print data 
+0

코드에 대한 지식이 없으면'str (...)'이 문제의 원인이 아닙니다. 여기에 콘텐츠에 액세스하는 다른 방법이 있어야합니다. –

+0

리스트를 유니 코드로 변환하기 위해 str 행 대신'data = [item.encode ('utf-8')'문서의 항목에''사용하려했으나 '셀 객체에 속성 인코딩이 없습니다' –

답변

0

으로 반복을 사용하여 각각의 단어에서 여분의 문자를 제거 : 그건 당신이 가지고있는 표준 입력 목록이 있다면

s=[] 
for x in list: 
    s.append(x[7:-1]) # Slice from index 7 till lastindex - 1 
+0

이 작업 됨 , 그러나 목록에있는 각 문자열의 끝 부분에 여분의''이 있습니다. –

+0

나는 이것을 대답으로 승인합니다. 감사합니다. @brokenfoot –

0

, 당신은 간단하게 함께 할 수 있습니다 split

[s.split("'")[1] for s in list] 

# if your string itself has got "'" in between, using regex is always safe 
import re 
[re.findall(r"u'(.*)'", s)[0] for s in list] 

#Output 
#['__string__', '__string__']