2011-12-18 2 views
4

DBpedia가 동일한 속성에 대해 여러 어휘를 사용하는 이유는 무엇입니까?
가능한 모든 동영상 데이터를 가져와야합니다.왜 DBpedia에서 동일한 속성에 대해 2 가지 다른 어휘를 사용해야합니까?

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> 
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> 

PREFIX foaf: <http://xmlns.com/foaf/0.1/> 

SELECT ?star_name 
WHERE { 
<http://dbpedia.org/resource/Goal_III:_Taking_on_the_World> dbpedia-owl:starring ?star. 
?star foaf:name ?star_name 
} 

내가 페이지 ID있을 것이다 : 나는 그것이 dbpedia 올빼미와 제작자, 감독에 대한 dbpprop 어휘를 가지고 등등 .. 나는 다음과 같은 쿼리 속성을 검색하는 것을 관찰 한 각 영화에 대한 각 영화의 별과 제작자를 검색 할 것입니다. 어떤 경우에는 dbpedia-owl이 작동하고 일부 dbpprop의 경우 작동합니다.

나는 그것에 대해 당혹 스럽다. 각 영화에 대해이 쿼리를 실행하려면 Python으로 코드를 작성해야합니다. 따라서 매번 결과가 null인지 확인하고 다른 어휘에 대한 코드를 실행해야합니다.

답변

1

DBPedia의 데이터는 해당 위키피디아 페이지에서 볼 수있는 정보 상자의 매핑 기반 언어를 사용하여 추출됩니다. 다른 정보 상자에 대해 서로 다른 매핑이 사용되므로 서로 다른 두 가지 유형의 자원을 완전히 다르게 매핑 할 수 있습니다. 생각하면 완벽하게 논리적입니다.

이제는 동일한 유형의 두 자원이 동일한 데이터를 다르게 매핑한다는 문제가 있습니다. 위키피디아의 데이터가 문제라는 점을 의심 스럽지만 (네가 속성을 다르게 매핑하는 두 개의 영화 예제를 제공하지 않았기 때문에 확인할 수는 없지만) 의심 스럽습니다. 정보 상자에서 관심있는 정보를 표현하는 방법은 여러 가지가있을 수 있으며 정보 상자에 대한 매핑이 다른 방법으로 다르게 매핑 될 수 있습니다. 이상적인 것은 아니지만 Wikipedia에는 ​​깨끗한 데이터가 없으므로 DBPedia에서 데이터를 정리할 필요가 없습니다.

DBPedia 메일 링리스트에 [email protected]의 질문을 던져보십시오. 왜 이런 일이 일어나는지 알아내는 데 도움이 될 수있는 이유를 알아보십시오.