나는 유리 염기 데이터 덤프를 분석하고 이제 다음과 같은 RDF를 가지고있다 : 나는 특정 자원의 이름과 유형을 추출 할 수있는 방법Name-Type exctraction을위한 Freebase rdf 덤프 구문 분석 ...?
<http://rdf.freebase.com/ns/m.0mspb64> <http://rdf.freebase.com/ns/type.object.type> <http://rdf.freebase.com/ns/music.release_track>
<http://rdf.freebase.com/ns/m.0mspb64> <http://rdf.freebase.com/ns/type.object.name> "Mit Rees und Hans im Bürgli"@de
<http://rdf.freebase.com/ns/m.0mspd6m> <http://rdf.freebase.com/ns/type.object.type> <http://rdf.freebase.com/ns/music.release_track>
<http://rdf.freebase.com/ns/m.0mspd6m> <http://rdf.freebase.com/ns/type.object.name> "Granny Scratch Scratch"@en
이 RDF 데이터 집합을 갖는? 예를 들어, 위 데이터에서 다음을 추출합니다.
Mit Rees und Hans im Bürgli ### music.release_track
Granny Scratch Scratch ### music.release_track
답장을 보내 주신 Tom 감사합니다. grep 명령을 사용하여 전체 덤프를 구문 분석 했으므로 Name-Type에만 관심이 있으므로 원하는 데이터 만 추출했습니다. 임시 저장소가 있고 데이터를 파싱 할 수 있다고 말한 것처럼 rdf가 필요하지 않다고 생각합니다. 자바로 할 계획입니다. 프로그래밍 언어 선택에 대한 제안이 있습니까? ?? –
실제로 압축 해제 된 데이터를 저장할 필요가 없기 때문에 실제로는'zgrep' 이었기를 바랍니다. 원래 주제 그룹을 보존 한 OR (|) 패턴을 사용했다면 인접한 두 개의 데이터가 있어야합니다. 이와 같은 빠른 프로그램을 사용하기 위해서는 아마도 Python을 사용하지만 Java는 제대로 작동합니다. –
고마워요. .. 자바에서 구현했습니다 .. 자바에서 편하지 .. –