2013-05-10 4 views
1

google Api freebase를 검색하고 싶습니다. 나는 일반적인 양의 데이터를 얻고 싶다. 예를 들어 모든 노래 또는 영화의 ID입니다. 데이터 덤프 gz 파일을 다운로드했습니다. 나는 파일을 파싱하고 내가 필요로하는 데이터를 얻는 최선의 해결책이 무엇인지 궁금하다. .net C#을 사용하고 있습니다.구글 API를 사용하여 Google Api FreeBase 데이터 덤프 구문 분석 #

답변

1

은 덤프의 RDF 형식으로 읽을 수있는 몇 .NET 라이브러리가 있습니다 : 데이터 덤프는 또한 탭으로 구분 된 값으로 지정됩니다

당신 때문에 모든 CSV 파서를 사용하여 각 라인을 트리플로 구문 분석 할 수 있어야합니다.

developer docs을 통해 데이터 덤프 형식을 읽어야합니다. 기본적으로 각 줄은 주제, 술어 및 객체가있는 트리플을 형성합니다. 영화에 대한 모든 데이터를 얻으려면/film /로 시작하는 술어가있는 트리플을 찾으십시오.

+0

CsvReader와 같은 이미 만든 파서를 사용해 보았는데 "LumenWorks.Framework.IO.Csv.MalformedCsvException '유형의 처리되지 않은 예외가 LumenWorks.Framework.IO.dll에서 발생했습니다."라는 오류가 발생했습니다. 어떤 아이디어? – Gidi

+0

쉼표가 아닌 탭으로 구분하라고 말씀하셨습니까? 또한 접두어 헤더가있는 처음 몇 줄을 건너 뛰도록 지시해야 할 수도 있습니다. 그 오류 메시지는 아무것도 될 수 있습니다. –

+0

배우 나 감독을 검색하는 방법을 알려주십시오. – Gidi