나는 http://en.wikipedia.org/wiki/PageRank에 설명을 읽었으며 페이지 순위는 들어오는 링크와 나가는 링크로 계산된다는 것을 알고 있습니다.페이지 순위가 실시간으로 계산되는 방법
웹 페이지를 크롤링하고 DB에 저장하는 동안 크롤러가 있는데 페이지 순위 알고리즘이 필요합니다. 내가 유 설명해 수 있습니다 다음과 같은 값
Title
url
content_html
outgoing_links(external domain)
internal_links(the links with same domain of the url)
와 DB를 가지고 내가하고 페이지 순위를 계산하기 위해 다른 값을해야합니까. 자바를 사용하여 계산하는 방법을 설명하시기 바랍니다
얼마나 멀리 갈 의향이 있습니까? Google의 실제 페이지 순위 알고리즘에 대해 말하면 훨씬 더 복잡하며 대부분은 완전히 비밀입니다. 시작하기 전에 Google은 도메인 이름의 나이와 콘텐츠가 업데이트되는 빈도를 고려합니다. 그러면 스팸 발송자를 어떻게 처리할까요? Google은 정기적으로 스패머와 전체 농장을 색인에서 제외합니다. 매우 복잡한 주제이며 * 페이지 순위를 계산할 수있는 하나의 마법 수식이 없기 때문에 "계산 방법"을 설명하기가 어렵습니다. – TacticalCoder