Python의 유니 코드 libxml2

문제점이 있습니다. xhtml 문서에서 검색 기능을 테스트하려고합니다. 검색은 아랍어 및 영어 텍스트를 지원해야합니다. 파이썬과 libxml2에 익숙하지 않아서 어떻게해야하는지 알아 내는데 어려움이 있습니다.Python의 유니 코드 libxml2

http://www.freeformatter.com/xpath-tester.html#ad-output과 같은 온라인 도구가 필요한 정확한 결과를 반환하더라도 항상 아랍어 텍스트 (영어로는 완벽하게 작동 함)로 빈 결과가 표시됩니다. 심지어

xPathQuery = u"//*[contains(text(), 'تجربة')]"

나 : 또한

import libxml2 

doc = libxml2.parseFile("content.xhtml") 

ctxt = doc.xpathNewContext() 

xPathQuery = "//*[contains(text(), 'تجربة')]" 

res = ctxt.xpathEval(xPathQuery) 

doc.freeDoc() 
ctxt.xpathFreeContext()

작동하지 않았다 유니 코드 문자열을 사용

그것은 코드 파일 인코딩 자체에 문제가 밝혀졌다

xPathQuery = u"//*[contains(text(), 'تجربة')]" 
res = ctxt.xpathEval(xPathQuery.encode('utf-8'))

출처

2014-09-28 Tamim Al Manaseer

예, 방금 질문을 업데이트했습니다. 여전히 작동하지 않습니다, 고맙습니다 :) –

을, 나는 구원 그것은 유니 코드로 작동했고 작동했습니다.

출처

2014-11-05 08:17:19

답변

관련 문제