2016-10-25 3 views
0

UTF-16 인코딩 된 XML 파일 세트로 작업하는 임. 예제 파일은 내가하고 싶었던 무엇 이 http://tipitaka.org/sinh/cscd/탭 브라우징을위한 Firefox 또는 유사한 응용 프로그램 UTF-16

주어진 키워드로 모든 파일을 모든 파일에서 키워드를 검색하고 열 수 있습니다 여기에 있습니다.

사용하는 스크립트는 이것입니다.

#!/bin/sh 
grep $1 *.xml | sed 's/ *:.*//' | uniq > list.dat 

while read line; do 
    gedit "$line" 
done < list.dat 

지금까지 나는 사용했다.

  1. Firefox - 파일을 잘 표시하지만 (firefox -new-tab 옵션) 탭에서 올바르게 열리지 않습니다. 현재 탭을 닫으면 두 번째 탭만 팝업됩니다.
  2. 크롬 - 예상대로 탭을 팝하지만 XML 파일
  3. gedit- 팝을 표시하지 않고 탭에 내용을 표시하지만 텍스트를 브라우저.

탭 서식의 모든 서식을 사용하여 XML 파일 목록을 열 수있는 응용 프로그램이나 수정 프로그램이 있습니까?

두 번째로 탭을 열면이 검색 텍스트를 강조 표시하는 방법이 있습니다.

감사합니다.

+0

나중에 무엇을하고 싶습니까? 개인적으로'grep'과'xmllint'와 같은 커맨드 라인 툴을 사용할 것입니다 ... – mb21

+0

안녕하세요, 내가 원하는 것은 읽기 용 응용 프로그램의 탭에 검색어가 들어있는 모든 문서를 여는 것입니다. 강조 표시는 장점입니다. – ABCD

답변

0

여기에는 필요한 기술 중 하나 또는 두 가지가 표시 될 수 있습니다.

import requests 
import webbrowser 

URLtemplate = 'http://tipitaka.org/sinh/cscd/abh02m.mul%s.xml' 

unencodedWord = 'වත්‌ථු' 
word = bytearray(unencodedWord.encode('utf-16be')) 

for k in range(0,18): 
    URL = URLtemplate % k 
    r = requests.get(URL) 
    print (r. apparent_encoding, end = '') 
    if r. apparent_encoding != 'UTF-16BE': 
     print ("can't process") 
     continue 
    else: 
     print() 
    if r.content.find(word) > -1: 
     webbrowser.open(URL) 
     input ('tap enter when ready for next page (if any):')