2017-12-21 23 views
0

JanusGraph로 일부 데이터를 가져 오려고합니다.JanusGraph로 파일 형식의 데이터를 가져 오는 방법

JanusGraph download에서 최신 버전을 받았습니다. Gremlin 콘솔을 열고 기본 연결을 자습서 시작에서 초기화했습니다.

gremlin> graph = JanusGraphFactory.open('conf/janusgraph-berkeleyje-es.properties') 

지금까지는 그렇게 좋았습니다. 꼭지점, 가장자리 및 색인을 만들었습니다. 그래서 지금은 콘솔에서 몇 가지 기본 작업을 수행 할 수 있습니다.

이제 테스트 용으로 일부 데이터를 가져 오려고합니다. 파일 형식과 데이터 형식에 신경 쓰지 않습니다. 파일을 준비 할 수 있습니다.

문제는 JanusGraph에서 데이터 파일을 가져 오는 좋은 방법을 찾을 수 없다는 것입니다.

단계별 안내에 도움을 줄 수있는 사람이 있습니까? 아파치 TinkerPop는 "시작하기"

답변

3

자습서는 CSV 데이터를로드하는 방법에 대해 설명합니다

http://tinkerpop.apache.org/docs/current/tutorials/getting-started/#_loading_data

단순히 그루비 스크립트를 작성하고, 그렘린 콘솔에서 실행을 포함하는 기본 과정. 스크립트는 사용자가 선택한 구문 분석 라이브러리를 사용하여 원하는 형식 (CSV, JSON, XML 등)으로 데이터를 읽어야합니다. CSV의 경우 표준 Groovy 클래스를 사용하는 자습서에서 설명한 간단한 접근 방법을 사용할 수 있지만 더 복잡한 CSV 파일의 경우 예를 들어 groovycsv과 같은 라이브러리를 사용할 수 있습니다. 여기에서 요점은로드하려는 데이터를 읽은 다음 위의 코드에서 인스턴스화 한 Graph 인스턴스에 데이터를 쓰는 것입니다. Gremlin addV()addE() 방법으로 그렇게 할 수 있습니다.

이와 같은 로딩 스크립트 개발은 대개 "더 작은"데이터 양을 의미합니다. 수십억 개의 가장자리 모서리가있는 그래프를로드해야하는 경우 이와 같은 접근 방식은 매우 오랜 시간이 걸릴 것입니다. 이 경우 데이터를 병렬로로드해야합니다 (예 : BulkLoaderVertexProgram)