2016-12-14 3 views
7

스위프트 3의 LibXML2에서 SAX 파서에 문제가 있습니다.
iOS에 Android의 XMLPullParser과 같은 것을 원합니다. 서버에서 XML을 다운로드하고 다운로드하는 동안 스트림을 구문 분석합니다.Swift 3에서 LibXML2로 다운로드하는 동안 서버에서 큰 XML 파싱하기

내 XML은 다음과 같습니다

<?xml version="1.0" encoding="UTF-8" ?> 
<ResultList id="12345678-0" platforms="A;B;C;D;E"> 
    <Book id="1111111111" author="Author A" title="Title A" price="9.95" ... /> 
    <Book id="1111111112" author="Author B" title="Title B" price="2.00" ... /> 
    <Book id="1111111113" author="Author C" title="Title C" price="5.00" ... /> 
    <ResultInfo bookcount="3" /> 
</ResultList> 

가 그래서 모든 데이터 속성이 아닌 자식 노드에 저장된다.

나는 대부분 이러한 예에 의해 기반 혼자 다음 클래스했습니다 :
XMLPerformance, XMLPerformance-Swift

import Foundation 

class LibXMLParser: NSObject, URLSessionDataDelegate { 

    var url: URL? 
    var delegate: LibXMLParserDelegate? 
    var done = false 
    var context: xmlParserCtxtPtr? 

    var simpleSAXHandlerStruct: xmlSAXHandler = { 
     var handler = xmlSAXHandler() 

     handler.initialized = XML_SAX2_MAGIC 
     handler.startElementNs = startElementSAX 
     handler.endElementNs = endElementSAX 
     handler.characters = charactersFoundSAX 
     //handler.error = errorEncounteredSAX 

     return handler 
    }() 

    init(url: URL) { 
     super.init() 

     self.url = url 
    } 

    func parse() { 
     self.done = false 
     let session = URLSession(configuration: .default, delegate: self, delegateQueue: OperationQueue.main) 
     let dataTask = session.dataTask(with: URLRequest(url: url!)) 
     dataTask.resume() 

     self.context = xmlCreatePushParserCtxt(&simpleSAXHandlerStruct, Unmanaged.passUnretained(self).toOpaque(), nil, 0, nil) 
     self.delegate?.parserDidStartDocument() 

     repeat { 
      RunLoop.current.run(mode: .defaultRunLoopMode, before: Date.distantFuture) 
     } while !self.done 

     xmlFreeParserCtxt(self.context) 
     self.delegate?.parserDidEndDocument() 
    } 

    func urlSession(_ session: URLSession, dataTask: URLSessionDataTask, didReceive data: Data) { 
     print("Did receive data") 
     data.withUnsafeBytes { (bytes: UnsafePointer<CChar>) -> Void in 
      xmlParseChunk(self.context, bytes, CInt(data.count), 0) 
     } 
    } 

    func urlSessionDidFinishEvents(forBackgroundURLSession session: URLSession) { 
     xmlParseChunk(self.context, nil, 0, 1) 
     self.done = true 
    } 

    func urlSession(_ session: URLSession, didBecomeInvalidWithError error: Error?) { 
     self.done = true 
     //self.delegate?.parserErrorOccurred(error) 
    } 

    func urlSession(_ session: URLSession, task: URLSessionTask, didCompleteWithError error: Error?) { 
     self.done = true 
     //self.delegate?.parserErrorOccurred(error) 
    } 
} 

private func startElementSAX(_ ctx: UnsafeMutableRawPointer?, name: UnsafePointer<xmlChar>?, prefix: UnsafePointer<xmlChar>?, URI: UnsafePointer<xmlChar>?, nb_namespaces: CInt, namespaces: UnsafeMutablePointer<UnsafePointer<xmlChar>?>?, nb_attributes: CInt, nb_defaulted: CInt, attributes: UnsafeMutablePointer<UnsafePointer<xmlChar>?>?) { 
    let parser = Unmanaged<LibXMLParser>.fromOpaque(ctx!).takeUnretainedValue() 
    parser.delegate?.parserDidStartElement(String(cString: name!), nb_attributes: nb_attributes, attributes: attributes) 
} 

private func endElementSAX(_ ctx: UnsafeMutableRawPointer?, name: UnsafePointer<xmlChar>?, 
          prefix: UnsafePointer<xmlChar>?, 
          URI: UnsafePointer<xmlChar>?) { 
    let parser = Unmanaged<LibXMLParser>.fromOpaque(ctx!).takeUnretainedValue() 
    parser.delegate?.parserDidEndElement(String(cString: name!)) 
} 

private func charactersFoundSAX(_ ctx: UnsafeMutableRawPointer?, ch: UnsafePointer<xmlChar>?, len: CInt) { 
    let parser = Unmanaged<LibXMLParser>.fromOpaque(ctx!).takeUnretainedValue() 
    parser.delegate?.parserFoundCharacters(String(cString: ch!)) 
} 

iOS-XML-Streaming가 나는 URL이 클래스를 초기화합니다. parse()을 호출하면 메서드를 재정의하기 위해 대리인이있는 URLSessionURLSessionDataTask이 생성됩니다. 그 후 나는 xmlParserCtxtPtr을 만들고 dataTask가 끝날 때까지 반복합니다.

데이터를받을 때 xmlParseChunk 메서드로 구문 분석하고 startElementSAX은 ViewController 클래스에서 설정 한 대리자를 호출합니다. (요소 이름, 속성 및 속성 수만 있으면됩니다.)
지금까지는 그렇게 좋았습니다. 내의 ViewController (있는 UITableViewController)에서

나는 다음과 같은 코드가 있습니다

func downloadBooksLibXML() { 
    print("Downloading…") 
    UIApplication.shared.isNetworkActivityIndicatorVisible = true 

    DispatchQueue.global().async { 
     print("Setting up parser") 
     let parser = LibXMLParser(url: URL(string: self.baseUrl + self.parameters!)!) 
     parser.delegate = self 
     parser.parse() 
    } 
} 

func parserDidStartDocument() { 

} 

func parserDidEndDocument() { 
    DispatchQueue.main.sync { 
     UIApplication.shared.isNetworkActivityIndicatorVisible = false 
     self.isDone = true 
     print("Finished") 
    } 
} 

func parserDidStartElement(_ elementName: String, nb_attributes: CInt, attributes: UnsafeMutablePointer<UnsafePointer<xmlChar>?>?) { 
    print(elementName) 
    switch elementName { 
    case "Book": 
     DispatchQueue.main.async { 
      let book = self.buildBook(nb_attributes: nb_attributes, attributes: attributes) 
      self.books.append(book) 

      self.tableView.beginUpdates() 
      self.tableView.insertRows(at: [IndexPath(row: self.books.count - 1, section: 0)], with: .automatic) 
      self.tableView.endUpdates() 
      self.navigationItem.title = String(format: NSLocalizedString("books_found", comment: "Books found"), "\(self.books.count)") 
     } 
    case "ResultList": 
     break 
    case "ResultInfo": 
     break 
    default: 
     break 
    } 
} 

func buildBook(nb_attributes: CInt, attributes: UnsafeMutablePointer<UnsafePointer<xmlChar>?>?) -> Book { 
    let fields = 5 /* (localname/prefix/URI/value/end) */ 
    let book = Book() 
    for i in 0..<Int(nb_attributes) { 
     if let localname = attributes?[i * fields + 0], 
      //let prefix = attributes?[i * fields + 1], 
      //let URI = attributes?[i * fields + 2], 
      let value_start = attributes?[i * fields + 3], 
      let value_end = attributes?[i * fields + 4] { 

      let localnameString = String(cString: localname) 
      let string_start = String(cString: value_start) 
      let string_end = String(cString: value_end) 
      let diff = string_start.characters.count - string_end.characters.count 
      if diff > 0 { 
       let value = string_start.substring(to: string_start.index(string_start.startIndex, offsetBy: diff)) 
       book.setValue(value, forKey: localnameString) 
      } 
     } 
    } 
    return book 
} 

func parserDidEndElement(_ elementName: String) { 

} 

func parserFoundCharacters(_ string: String) { 

} 

func parserErrorOccurred(_ parseError: Error?) { 

} 

------

업데이트

그래서 속성 값을 받고 문제가 고정되었습니다 대답은 nwellnhof. 위의 코드를 훨씬 더 나은 코드로 업데이트했습니다. 이제 더 이상 모든 속성을 반복하지 않습니다. 내 새로운 문제 :

Book XML 속성 개체를 얻으려면 buildBook 메서드를 만들었습니다. 나는 여기에서 What is the right way to get attribute value in libXML sax parser (C++)?의 방법을 Swift로 번역했고, setValue(value: Any?, forKey: String)을 사용하여 my book 개체의 속성을 설정했습니다.

하지만 지금 내 문제는 그것이 tableView를 업데이 트하지 않는다는 것입니다. DispatchQueue.global().sync을 사용하는 백그라운드 스레드에서 buildBook 동기식 메서드를 실행하고 DispatchQueue.main.async을 사용하여 비동기 메인 스레드에서 tableView 업데이트를 실행 해 보았습니다. 그렇지만 그것은 주 스레드에 있지만 tableView.endUpdates()에서 충돌합니다.

------

도움을 주시면 감사하겠습니다.

답변

0

단순한 off-by-one 오류와 같습니다.C의 속성 배열을 반복하기 위해, 나는 같은 것을 쓸 것 :

for (int i = 0; i < nb_attributes; i++) 

을하지만 당신은 상한 포함 closed range operator 사용하고 있습니다 :

for i in 0...Int(nb_attributes) 

그래서 당신이 half-open range operator을 대신 사용해야를 : 그런데

for i in 0..<Int(nb_attributes) 

, libxml2를는 C#의 XmlTextReader 본뜬 pull parser interface을 갖는다 이것은 SAX 파서보다 훨씬 사용하기 쉽다.

+0

예, 꺼짐 별 오류입니다. 당신이 이것을 발견해 주셔서 감사합니다. 하지만 지금은 또 다른 문제가 있습니다. 내 질문을 업데이트했습니다. 어쩌면 당신은 이것에 대한 해결책을 알고 있습니까? 또는 iOS (Swift (3) 또는 Obj-C) 용 XmlTextReader를 사용하는 방법에 대한 자습서가 있습니까? – ElegyD

+0

@ ElegyD 다른 문제가있는 경우 별도의 질문을하는 것이 좋습니다. – nwellnhof