2017-02-23 8 views
0

I는 followig 데이터와 CSV 파일 (작은 발췌)가 : I는 I가 피보호자에서 생성 올빼미 형식 온톨로지가온톨로지에서 클래스 생성을 자동화하는 방법은 무엇입니까?

ITEM_ID FAMILY  SUBFAMILY 
555  Adventure Adventure and extreme sports 
444  Nightlife International restaurants 
333  Adventure Adventure and extreme sports 

한다. 온톨로지에 CSV 파일을로드 할 수 있다는 것을 알고 있습니다. 이미 모든 클래스 (예 : "어드벤처", "나이트 라이프"등)를 가족과 "어드벤처 및 익스 트림 스포츠", "인터네셔널 레스토랑" SUBFAMILY에서 등). 이를 위해 SPARQL을 사용하여 항목 (ITEM_ID)을 인스턴스로로드 할 수 있습니다.

하지만 SPARQL 및 CSV를 사용하여 클래스 생성을 자동화 할 수 있습니까? 아이디어는 CSV에 저장된 FAMILY 및 SUBFAMILY를 기반으로 수천 개의 클래스를 수동으로 생성하는 것을 피하는 것입니다.

+2

도구 목록을 보려면 https://www.w3.org/wiki/ConverterToRdf#CSV_.28Comma-Separated_Values.29를 참조하고 W3C 권장 사항은 https://www.w3.org/TR/csv2rdf/를 참조하십시오. http://stackoverflow.com/questions/13147864/how-to-create-an-ontology-from-raw-data-csv와 관련이 있습니다. – AKSW

답변

2

실제로 그렇게 할 수있는 방법이 많이 있습니다. 여기에 지금까지 사용했던 몇 가지의 : RDF와

1 OpenRefine 플러그인

내 원하는 옵션 Open Refine을 사용하는 것입니다 행사 일회성를 들어

(구 구글 조정)

가져올 수 있습니다 온톨로지를 다른 사람들과 함께 사용하고 데이터를 이해하는 데 사용합니다. 루트 노드를 선택하십시오. 고유 ID가없는 경우 추가 열에서 생성 할 수 있습니다. 루트 노드로 처리해야만 URI를 입력 할 수 있습니다 (하나 이상의 다른 온톨로지로 분류 됨). 그런 다음 온톨로지의 어떤 속성을 CSV의 헤더에 매핑해야할지 선택하면 각 열의 모든 셀이 자동으로 생성됩니다. 사용자가 모델화 한 트리플 패턴의 객체, 선택한 유형의 객체 및 URI, 텍스트로 처리됩니다. , 날짜 등 - 선택할 수있는 옵션이 많습니다. 그런 다음 RDF/XML 또는 RDF/Turtle 형식으로 내보낼 수 있습니다.

CSV 파일이 매우 큰 경우 Open Refine의 메모리를 늘릴 수 있습니다. 지금까지 열이 꽤 많았 기 때문에 CSV를 약 50 만 행으로 변환 할 수있었습니다. 결과 파일에는 엄청난 수의 트리플이있었습니다.

그러나 대용량 CSV 파일을 사용하는 경우 Protégé는 파일을 열거 나 매우 느리게 작동합니다.

2. 거장 CSV는 여러 가지 옵션이 R2RML뿐만 아니라, Open Data Spaces를 사용하여 포함이있다

spongers.