2012-10-21 1 views
2

Hadoop 및 페이지 순위 사용에 대한 경험이 필요합니다. 나는 Hadoop을 사용하여 페이지 순위 알고리즘의 간단한 구현을 완료했다. 이제 알고리즘 매개 변수를 거의 변경하지 않고 페이지 순위에 미치는 영향을 분석하여 가능한 영향을 분석 할 계획입니다. 지금은 매달려있는 노드가 페이지 순위에 어떤 영향을 주는지 분석하고 있습니다. 이 페이지 랭크에 어떤 다른 변형을 만들 수 있는지에 대한 제안은 내가 더 깊은 지식을 얻는 데 크게 도움이 될 것입니다.hadoop을 사용한 페이지 순위

감사

답변

2

변화의 몇 내가 알고 :

  • 가중 페이지 랭크 (PageRank) 알고리즘 : 골고루 큰 순위 값에 더 중요한 (인기) 페이지 대신 페이지의 순위 값을 나누어 할당 그것의 outlink 페이지.
  • Topic-sensitive pagerank. 검색 쿼리 결과의 순위를 개선하기위한 원래의 페이지 랭크 (PageRank) 알고리즘에서

    는 하나의 페이지 랭크 (PageRank) 벡터는, 특정의 독립적 상대적 중요성 "ofWeb 페이지를 캡처, 웹의 링크 구조를 이용하여 계산된다 보다 정확한 검색 결과를 얻으려면 대표 주제 집합을 사용하여 편향된 PageRank 벡터 집합을 계산하여 특정 주제와 관련하여 중요도 개념 인 을보다 정확하게 캡처 할 수 있습니다.
  • Z. Gy H. Garcia-Molina, J. Pedersen, "Combating link spam with trustrank",
  • 또한 HITS (하이퍼 링크 환경에서 신뢰할 수있는 소스)을 시도 할 수 있습니다.
  • 더 나아가 TupleRank: Ranking Relational Databases using Random Walks on Extended K-partite Graphs과 같은 다른 도메인에 PageRank 아이디어를 적용 할 수 있습니다.

+0

정말 감사합니다. 그게 크게 도움이 – stackuser

+0

당신은 오신 것을 환영합니다! – greeness