2016-09-11 3 views
6

Wikidata (Wikidata SPARQL endpoint)에서 SPRQL 쿼리 결과를 PageRank와 같은 것으로 주문할 수 있습니까?Wikidata 결과가 PageRank와 비슷한 방식으로 정렬 됨

SELECT DISTINCT ?entity ?entityLabel WHERE { 
    ?entity wdt:P31 wd:Q5. 
    SERVICE wikibase:label { 
    bd:serviceParam wikibase:language "en" . 
    } 
} LIMIT 100 OFFSET 0 

우리는에 의해 결과를 정렬 할 필드를 지정할 수 있으며, 해당 필드는 상단에있는 엔티티/인식 더/주목할만한 중요하다는 것을 표현하고 그 등등 하나를 다음?

+0

비슷한 질문을 여기에? http://stackoverflow.com/questions/39040060/sparql-select-the-most-relevant-category-of-a-dbpedia-resource –

+0

그 질문과 정확히 같지 않은 것은 DBpedia와 관련이 있으며 광산은 Wididata와 관련이 있습니다. DBpedia에는이 "pagerank"http : //people.aifb.kit이 있습니다.edu/ath/# DBpedia_PageRank는 관련성에 따라 결과를 정렬하는 데 도움을줍니다. 제 질문은 Wikidata가 제가 사용할 수있는 등급과 동일한 등급을 가지고 있는지입니다. – jordipala

답변

2

PageRank는 위키 대타와 관련하여별로 의미가없는 것으로 보입니다. 분명히 큰 클래스와 커다란 집합체가 리더가 될 것입니다.

또한 웹 링크와 달리 RDF 조건부는 양쪽에서 탐색 할 수 있습니다. URI가 주제이고 어떤 URI가 객체인지는 디자인의 문제 일뿐입니다.

그러나 Andreas Thalhammer continues 그의 작품. 10 위키 데이터 개체는 다음과 같습니다 불행하게도, DBpedia의 pageranks 달리, 위키 데이터의 pageranks 엔드 포인트에 게시되지 않습니다

Q729 animal  24996.77 
Q30  USA   24772.45 
Q1360 Arthropoda 16930.883 
Q1390 insects  16531.822 
Q35409 family  14403.091 
Q756 plant  14019.927 
Q142 France  13723.484 
Q34740 genus  13718.484 
Q16  Canada  12321.178 
Q159 Russia  11707.16 

은, 하나는 SPARQL을 사용하여 쿼리 할 수 ​​없습니다.


다행히도, 일종의 순위를 알아낼 수 있습니다. 가능한 옵션은 다음과 같습니다 outcoming 문

  1. (precalculated);
  2. 사이트 링크 수 (precalculated);
  3. 수신 문 수 (아래 예에서는 truthy 문만 계산됩니다).

예 질의 :

SELECT ?item ?itemLabel ?outcoming ?sitelinks ?incoming { 
    ?item wdt:P31 wd:Q185441 . 
    ?item wikibase:statements ?outcoming . 
    ?item wikibase:sitelinks ?sitelinks . 
     { 
     SELECT (count(?s) AS ?incoming) ?item WHERE { 
      ?item wdt:P31 wd:Q185441 . 
      ?s ?p ?item . 
      [] wikibase:directClaim ?p 
     } GROUP BY ?item 
    } 
    SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }. 
} ORDER BY DESC (?incoming) 

Try it!

이러한 모든 측정은 어느 정도 상관 관계가 있습니다. 여기 아래

scatterplot matrix

는 EU 회원을위한 이러한 조치의 상관 계수이다.

Pearson 
------- 
      outcoming sitelinks incoming pagerank  
outcoming 1.0000 0.6907 0.7416 0.8652 
sitelinks 0.6907 1.0000 0.4314 0.5717 
incoming  0.7416 0.4314 1.0000 0.8978 
pagerank  0.8652 0.5717 0.8978 1.0000 


Spearman 
-------- 
      outcoming sitelinks incoming pagerank 
outcoming 1.0000 0.6869 0.7619 0.8736 
sitelinks 0.6869 1.0000 0.7680 0.8342 
incoming  0.7619 0.7680 1.0000 0.8872 
pagerank  0.8736 0.8342 0.8872 1.0000 


Kendall 
------- 
      outcoming sitelinks incoming pagerank 
outcoming 1.0000 0.4914 0.5661 0.7143 
sitelinks 0.4914 1.0000 0.5764 0.6454 
incoming  0.5661 0.5764 1.0000 0.7249 
pagerank  0.7143 0.6454 0.7249 1.0000 

은 참조 :