0

누구나 PageRank, HITS와 같은 웹 순위 알고리즘이 포함 된 라이브러리를 소개 할 수 있습니까? 감사합니다.웹 순위 지정 및 검색 엔진 용 C++ 라이브러리

+0

나는 이러한 라이브러리가 존재한다는 것을 진지하게 생각합니다. AFAIK, PageRank 등은 비밀 알고리즘입니다. –

+0

유용한 정보가 들어있을 수있는 관련 게시물로 이어질 가능성이 있으므로이 질문의 태그를 다시 지정했음을 유의하십시오. 해당 태그를 클릭하여 찾아 보거나 믹스 할 수 있습니다. 예 : http://stackoverflow.com/questions/tagged/c%2b%2b%20search-engine – HostileFork

답변

1

내가 the original PageRank paper에 발표 된대로 표준 페이지 랭크 (PageRank) 알고리즘을 다스 려하는 것 같아요. 오늘날 사람들은 "PageRank"를 사용하여 검색을위한 실제 Google 알고리즘을 참조합니다.

실제로 그렇다면 PageRank 구현을 찾아 사용하기가 어렵지 않습니다. Google을 통해 검색하면 많은 구현을 찾을 수 있습니다. 예를 들어 One in python.

HITS 알고리즘의 경우 pseudocode in wikipedia이 있습니다. Perl implementation도 있습니다.

CLucene 당신이 장난하기 시작할 수도 있습니다.

+0

그러나 clucene에는 설명서가 없습니다. C++에서 어떻게 사용할 수 있는지 알고 있습니까? – orezvani

0

Google을 위해 일하지 않는 한, 때때로 페이지 변경 알고리즘의 특성을 알아낼 수있는 좋은 방법이 많지 않습니다.

http://en.wikipedia.org/wiki/PageRank

다른 사람들이 긴 기사를 작성 : 위키 백과는 몇 가지 기본 사항을 설명

당신이 검색 엔진을 쓰기에 관련된 기술의 종류에 관심이 있다면 http://www.smashingmagazine.com/2007/06/05/google-pagerank-what-do-we-really-know-about-it/

몇 가지 주제가 있습니다. 예를 들어, "웹 크롤링"어떻게 웹 사이트를 방문 프로그램을 작성하고 그 내용을 잡아 ... 그리고 그들이 변경 한 있는지 확인하기 위해 다시 사이트를 방문 할 때 결정이 :

http://en.wikipedia.org/wiki/Web_crawler

분석하고 검색 할 수있는 컴퓨터 (들)에 대한 데이터의 무리가 있으면, 연구 주제 영역은 "정보 검색"(또는 "IR")라고 :

http://en.wikipedia.org/wiki/Information_retrieval

그것은 상당히 새로운 과학이다 하지만 많은 작업이 완료되었습니다. 위키 백과는 "무료 검색 엔진 소프트웨어"의 목록을 가지고 :

http://en.wikipedia.org/wiki/Category:Free_search_engine_software

난 당신이를 처음 사용하는 경우 다음의 정보는 다음의 제품에 루씬 같은 것을 사용하는 방법을 알아내는 시작하는 것이 최선이 될 수 있다는 게 좋을 것

보유하고있는 웹 사이트에 검색 창을 제공하십시오. 그런 다음 파고 들어가서 어떻게 작동하는지 확인하십시오. 이 당신에게 중요하다면 C++로 포팅되었습니다

http://clucene.sourceforge.net/

+0

완벽한 정보를 제공해 주셔서 감사합니다. 그러나 나는 Web Information Retrieval의 일부인 Web Ranking에 초점을 맞추었다. 나는 그들의 결과를 내 것과 비교하기 위해 PageRank와 다른 것들과 같은 순위 알고리즘의 구현을 필요로한다. – orezvani

+0

당신은 그 자유로운 검색 엔진 소프트웨어 연결을 시도 할 수 있고 어쩌면 그들이 계산하는 순위를 보여주는 일종의 데이터 파일을 얻을 수있을 것입니다.그러나 Google의 방법과 비교할 수있는 유일한 방법은 견본 데이터 세트를 만든 다음 Google Site Search를 사용하거나 Google 검색 어플라이언스를 구매하는 것입니다. 다양한 용어로 피드하고 자신의 인기 히트작이 무엇인지 비교하십시오 동일한 데이터 : http://www.google.com/enterprise/search/gsa.html – HostileFork

+0

PageRank, HITS 등과 같은 일부 famouse 순위 알고리즘이 있습니다. 많은 논문에 게재되었습니다. 나는 그들과 나의 결과를 비교할 필요가있다! 나는 그들의 구현을 원한다! 너는 어떤 생각을 가지고 있니? – orezvani