2012-03-08 1 views
4

에 의해 정렬은 어떻게 유형의 이름을 반환 할 수있는 유리 염기 ID유리 염기 형태의 일반 이름을 얻고 공통성

{ 
    "id": "/m/02mjmr", #obama 
    "type":[] 
}​ 

에서 공통 이름으로 형식의 목록을 얻을 수있을합니다 ID 대신에? 위의 결과는

0: "/common/topic"xp 
1: "/people/person"xp 
2: "/user/robert/default_domain/presidential_candidate"xp 
3: "/book/author"xp 
4: "/award/award_winner"xp 
5: "/book/book_subject"xp 
6: "/user/robert/x2008_presidential_election/candidate"xp 
7: "/government/politician"xp 
8: "/organization/organization_member"xp 
9: "/user/robert/default_domain/my_favorite_things"xp 

마지막으로 어떻게 개수별로 정렬 할 수 있습니까? 또는 아마도 가능성에 의해?

즉,

President 
Nobel Prize Winner 
Author 
Person 

등?

아마도 주목할만한 유형의 API와 비슷한 것이지만 멀리 가고있는 것처럼 보입니까?

http://wiki.freebase.com/wiki/Notable_types_API

답변

3

당신은 이름과 인스턴스를 얻을 수 있습니다 당신은 당신의 인스턴스가 유명 함을 얻기 위해 일종의 계산 반전 수 있도록, 낮은 주파수는 "주목할만한"의

{ 
    "id": "/m/02mjmr", 
    "type": [{ 
    "name":   null, 
    "id":null, 
    "/type/type/domain":{"key":[{"namespace":"/","limit":0}],"id":null} 
    "/freebase/type_profile/instance_count": null, 
    "sort":"/freebase/type_profile/instance_count" 
    }] 
}​ 

한 정의와 계산합니다. 이를 Freebase "commons"의 유형으로 제한하면 시끄러운 사용자 유형이 제외됩니다. 공유지 유형을 식별하는 한 가지 방법은 루트 네임 스페이스 (예 :/government와 같은 단일 경로 세그먼트)에있는/유형/유형/도메인 속성 값을 찾는 것입니다.

예를 들어, 최저 빈도 커먼 유형은

43 /government/us_president  US President /government 
51 /people/appointer Appointer /people 
73 /architecture/building_occupant Building Occupant /architecture 
204 /government/political_appointer Political Appointer  /government 
230 /book/poem_character  Poem character /book 
254 /event/public_speaker Public speaker /event 

귀하의 응용 프로그램에 대해 중요하지 않은 유형을 블랙리스트에 추가하여 필터링을 더 세분화 할 수 있습니다. 현재 2134 개의 커먼 타입이 있으며 그 중 다수가 시스템 사용을위한 원시 데이터 타입이나 사물입니다. 따라서 전체 목록을 검토하고 처리하는 데 오래 걸리지 않을 것입니다.

+0

내가 폼 태그 제안 기능에 대한 목록 주목할만한 유형을 싶어. 빈도가 낮 으면 애매한 태그이기도합니다. 내가 어떻게 그들을 버리고 가장 주목할만한 것을 지킬 수 있습니까? – ere

+0

시끄러운 사용자 정의 유형을 필터링하는 방법을 보여주기 위해 쿼리와 설명을 업데이트했습니다. –

+0

그 완벽한 감사합니다! – ere

1

Freebase Search API에서 각 결과와 함께 하나 이상의 주목할만한 유형을 반환하는 데 관심이있을 수 있습니다. 이 같은 MID하여 특정 항목을 검색 할 수 있습니다

https://www.googleapis.com/freebase/v1/search?query=/m/02mjmr&indent=true

+0

나는 이것을 위해 검색 API를 사용하고 싶다. 가장 주목할만한 알고리즘이 내가 만드는 것보다 낫다는 것이 확실하지만, 일반적으로 주목할만한 유형을 하나만 던져 버리는 경우가있다. 이 경우에는 "미국 대통령"입니다. ;-( – ere

+0

Google은 주목할만한 유형을 어떻게 선택했는지 문서화 한 적이 없지만 필자가 회신 할 때와는 거리가 멀지 않은 것으로 판단됩니다. 모든 알고리즘은 빈 세트를 반환 할 가능성이 있습니다. –

+0

주목할만한 유형 알고리즘은 Bryan Culbertson이 app (http://types.namesbc.user.dev.freebaseapps.com/index?suggest=Barack+Obama&id=%2Fen%2Fbarack_obama)에서 시작했으며 Tom의 예와 같은 인스턴스의 수. –