2011-12-05 7 views
5

mediawiki API를 통해 검색 한 페이지를 구문 분석 할 .Net 라이브러리가 있습니까? 순수한 데이터로 제목과 데이터를 제공 할 수있는 표준 미디어 위키 파서는 괜찮을 것이지만 위키 백과에 특히 적합한 단어 하나를 갖고 싶습니다. 단어의 유형과 정의를 모두 알려줄 수 있습니다.위키 낱말 사전

나는 이것을 위해 내 자신의 파서를 쓰지 않기를 바랄 것이다. 어떤 제안?

+1

API에서 소비하는 출력 형식은 무엇입니까? 현재 선택할 수있는 9 개가 있습니다. –

+0

@Alex 여기에 몇 가지 예제가 있습니다. http://www.mediawiki.org/wiki/API:Parsing_wikitext –

+0

API 또는 클라이언트 라이브러리를 인식하지 못합니다. Wiktionary 데이터를 구조화 된 형식으로 제공합니다 (HTML 또는 raw wikitext와 반대). 그리고 다시, 나는별로 보지 못했다. –

답변

2

JSON에서 출력을 얻는다면 사용할 수있는 옵션이 많이 있습니다.이 옵션은 .NET에 내장되어 있으며 프레임 워크 자체 외부에 있습니다.

XML로 결과를 얻는다면 .NET Framework 자체와 프레임 워크 외부에서 강력한 XML 조작 클래스가 있습니다.

좀 더 구체적으로 설명해야합니다. 형식과 출력 예제를 제공하십시오.

+1

나는 이것을 다음과 같이 사용합니다 : http://en.wiktionary.org/w/api .php? action = query & prop = revisions & rvprop = content & titles = 페이지를 만들기 위해 mediawiki에 입력하는 것과 같은 코드 인 wiki 코드가 나온다. – Bananable

1

dbnary 프로젝트는 RDF 형식의 위키피언에서 파싱 된 정보를 제공합니다.

무언가를 더 처리하기를 원하면 WikDict 프로젝트의 일부로 dbnary 데이터에서 생성 된 SQLite 및 TEI 파일을 download.wikdict.com에 제공하십시오.

.net 라이브러리에 대한 질문에는 실제로 대답하지 않지만 XML (TEI), SQLite 또는 RDF를 쉽게 찾을 수있는 라이브러리를 찾을 수있을 것입니다.