2017-03-07 3 views
0

배경 : StAX를 사용하여 여러 부분으로 XML 문서를 분할합니다. 예를 들어 각 단락을 개별적으로 저장하는 경우. 이렇게하려면 XMLEventReader을 사용하여 문서를 읽고 이벤트를 반복합니다. 내가 요소를 만날 때 나는 그것을 StringWriter에 복사하고 문자열의 내용을 유지합니다.처리 명령 대상과 데이터 사이의 공간이 복사 요소에서 제거되었습니다.

그러나 처리 명령을 만났을 때 문제가 발생합니다.

package com.util.xml; 

import static org.assertj.core.api.Assertions.assertThat; 

import java.io.StringWriter; 

import javax.xml.stream.XMLEventReader; 
import javax.xml.stream.XMLInputFactory; 
import javax.xml.stream.XMLStreamConstants; 
import javax.xml.stream.events.XMLEvent; 

import org.apache.commons.io.IOUtils; 
import org.junit.Test; 

import javanet.staxutils.XMLStreamUtils; 
import javanet.staxutils.io.StreamEventWriter; 

public class XmlUtilTest { 

    @Test 
    public void xml_with_processing_instruction_is_retained() throws Exception { 
     final XMLInputFactory inputFactory = XMLInputFactory.newInstance(); 
     final String xml = "<p><?processing-instruction user=\"stuart\"?>Title</p>"; 
     final XMLEventReader eventReader = inputFactory.createXMLEventReader(IOUtils.toInputStream(xml)); 

     final StringWriter stringWriter = new StringWriter(); 
     while (eventReader.hasNext()) { 
      final XMLEvent event = eventReader.peek(); 
      if (event.getEventType() == XMLStreamConstants.START_ELEMENT) { 
       XMLStreamUtils.copy(eventReader, new StreamEventWriter(stringWriter)); 
       break; 
      } else { 
       eventReader.nextEvent(); 
      } 
     } 

     final String output = stringWriter.toString(); 
     assertThat(output).isEqualTo(xml); 
    } 
} 

는 I 출력이 입력 (이것은 단순한 복사본이다), 처리 지시 대상 (processing-instruction)와 데이터 사이 그러나 공간 (동일한 것으로 예상 : 다음 코드의 문제점을 복제 한 user=\"stuart\")이 제거되고 : 내가 모르는 뭔가가

org.junit.ComparisonFailure: expected:<...ocessing-instruction[ ]user="stuart"?>Title...> but was:<...ocessing-instruction[]user="stuart"?>Title...> 
    at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method) 
    at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:62) 
    at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45) 
    at com.util.xml.xmlcontent.ingestion.XmlUtilTest.xml_with_processing_instruction_is_retained(XmlUtilTest.java:38) 
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) 
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62) 
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) 
    at java.lang.reflect.Method.invoke(Method.java:498) 
    at org.junit.runners.model.FrameworkMethod$1.runReflectiveCall(FrameworkMethod.java:50) 
    at org.junit.internal.runners.model.ReflectiveCallable.run(ReflectiveCallable.java:12) 
    at org.junit.runners.model.FrameworkMethod.invokeExplosively(FrameworkMethod.java:47) 
    at org.junit.internal.runners.statements.InvokeMethod.evaluate(InvokeMethod.java:17) 
    at org.junit.runners.ParentRunner.runLeaf(ParentRunner.java:325) 
    at org.junit.runners.BlockJUnit4ClassRunner.runChild(BlockJUnit4ClassRunner.java:78) 
    at org.junit.runners.BlockJUnit4ClassRunner.runChild(BlockJUnit4ClassRunner.java:57) 
    at org.junit.runners.ParentRunner$3.run(ParentRunner.java:290) 
    at org.junit.runners.ParentRunner$1.schedule(ParentRunner.java:71) 
    at org.junit.runners.ParentRunner.runChildren(ParentRunner.java:288) 
    at org.junit.runners.ParentRunner.access$000(ParentRunner.java:58) 
    at org.junit.runners.ParentRunner$2.evaluate(ParentRunner.java:268) 
    at org.junit.runners.ParentRunner.run(ParentRunner.java:363) 
    at org.eclipse.jdt.internal.junit4.runner.JUnit4TestReference.run(JUnit4TestReference.java:86) 
    at org.eclipse.jdt.internal.junit.runner.TestExecution.run(TestExecution.java:38) 
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.runTests(RemoteTestRunner.java:459) 
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.runTests(RemoteTestRunner.java:678) 
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.run(RemoteTestRunner.java:382) 
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.main(RemoteTestRunner.java:192) 

암을?

+0

xml과 그 기준을 나눌 수 있습니까? –

+0

이 질문과 관련이 없으며 분할 프로세스가 만족 스럽습니다. 문제는 처리 지침을 처리하므로 사이드 트랙을 얻고 싶지 않습니다. – Stu

답변

0

XML 사양은 파서가 이러한 경우 응용 프로그램에보고해야 할 내용에 대해 매우 모호합니다. 처리 명령의 문법은

PI ::= '<?' PITarget (S (Char* - (Char* '?>' Char*)))? '?>' 

및 다른 대부분의 경우에

는 "S는"너무 많은 사람들이 처리 명령의 공백을 "무시할"라고 가정 한 무시할 수로 처리됩니다 공백을 나타냅니다 때문에하지 않는 것입니다 응용 프로그램에보고해야합니다.

여기에 지적한대로 : How do I format and read XML processing instructions using Java StAX? Stax 사양은 그러한 세부 사항에 대해 악명이 높습니다.