xlrd를 사용하여 python3에 엑셀 파일을로드하고 있습니다. 기본적으로 스프레드 시트의 텍스트 줄입니다. 이 줄 중 일부는 따옴표입니다. 예를 들어 한 줄은 다음과 같습니다.파이썬 문자열에서 이상한 큰 따옴표 (엑셀 파일에서) 제거하기
그녀는 "제 이름은 제니퍼입니다."라고 말했습니다.
파이썬으로 읽어서 문자열로 만들 때, 큰 따옴표는 따옴표로 묶여있는 이상한 큰 따옴표 문자로 읽혀집니다. 나는 그 길을 따라 어딘가에 있다고 가정하고 있는데, 파이썬은 어떤 인코딩 문제로 인해 실제 큰 따옴표가 아닌 일부 외국 문자로 문자를 읽습니다. 그래서 위의 예제에서, "text"로 그 라인을 지정하면, 다음과 같은 것을 갖게 될 것입니다. (실제로는 라인을 타이핑하지 않았기 때문에 정확하지 않습니다. 그래서 "텍스트"가 이미 미리 지정되었다고 상상해보십시오) :
text = 'She said, “My name is Jennifer.”'
text[10] == '"'
두 번째 줄은 일반 큰 따옴표 문자로 인식되지 않으므로 False로 출력됩니다. 나는 그것이 차이를 만드는 경우 맥 터미널에서 일하고있다.
내 질문 : 1. 이상한 큰 따옴표를 쉽게 제거 할 수있는 방법이 있습니까? 2. 파일을 읽어 파이썬이 이중 따옴표로 인식하도록하는 방법이 있습니까?
유니 코드 :'''는 U + 201C이고''는'U + 201D '입니다. U + 0022 인'''로 대체해야합니다. –