2013-08-26 7 views
0

나는 지금이 문자열의 4 개 부분 본질적으로가 형식에게다음 형식 문자열을 구문 분석하려면 어떻게해야합니까?

<foo bar> <property abc> <this foo bar> . 

다음의 데이터가 : foo bar가; property abc; this foo bar; 및 .. 위의 문자열을이 네 부분으로 토큰 화하는 방법은 무엇입니까? 다른 사람들이 당신이 RDF 그래프 그냥 Apache Jena 같은 라이브러리를 사용하는 구문 분석하려면 제안으로

+0

당신은 무엇을하려고 애 쓰고있는 트리플/쿼드 수준에서 구문 분석으로 데이터 처리에 제어하기 위해 내장 파서와 이것을 사용 구문 분석하려면? (다만 당신을 위해 그것을하는 몇몇 도서관이있다) –

+0

rdf는 그래프를 형성했다 – Fraz

+3

"rdf 파서 자바"를 googling 저를 얻었다 http://stackoverflow.com/questions/73445/what-are-some-good-java-rdf- 라이브러리 –

답변

0
String[] array = string.split("> "); 

for (int i = 0; i < array.length -1; i++){ 
    System.out.println(array[i] + ">"); 
} 
System.out.println(array[array.length-1]); 
+2

그러면 첫 번째 요소는' marderh

+0

@marderh 편집으로 수정되었습니다. – Brinnis

+0

정말이에요? 또한 그것은 위의 질문을 해결하지 않습니다 .. – marderh

1

(면책 조항 - 나는 개발자 중 하나입니다).

문제는 다음 몇 가지 옵션이 있습니다 구문 분석 과정을 직접 제어를 필요 이상이면 :

  • 예나가 작업 할 경우 데이터처럼 NTriple/거북이/SPARQL을 토큰 화 할 수있는 TokenizerText 클래스가 텍스트 형식의 수준
  • 의 데이터와 당신은 StreamRDF 인터페이스를 구현할 수 있으며이