Mapreduce를 사용하여 위키피디아의 내부 페이지 순위를 찾으려고합니다. 위키 페이지의 작은 하위 집합에서 Pagerank 알고리즘을 구현했습니다. 페이지가 있습니다. 나는이 공식을 사용하여 pagerank (d = 0.85)를 계산했습니다. 페이지 순위에 대한 의문점
each PageRank is multiplied by N and the sum becomes N
위의 공식을 사용하는 경우 모든 6349 페이지의
1. 총 페이지 순위 WikiPedia에 1001.26044
2.According입니다. 각 페이지 순위에 N (6349)을 곱하고 합계를 계산하면 6356789.5입니다.
페이지 순위 합계가 총 페이지 수와 같지 않은 이유가 있습니까? 확인할 때 두 번째 수식을 사용해야합니까?
참고 : 나는 좋은 근사치를 얻기 위해 10 반복 내 맵리 듀스 코드를 실행했습니다.
지난 2 번의 반복의 총 페이지 순위 차이를 계산해 주시겠습니까? 나는 중간이나 최대의 의미를 이해하지 못한다. 가능한 오류를 어떻게 평가할 수 있습니까? –
당신은 진정한 홍보를 기억하지 못합니다, 기억합니까? 따라서 결과 반복의 결과를 비교해 보면 얼마나 가까운지 알 수 있습니다. 그러나이 결과는 숫자가 아니며 6k 멤버의 벡터입니다. 따라서, 만약 당신이 그것들을 비교하기를 원한다면, 당신은 어떤 차이, 즉 중간 차이 또는 최대 차이를 선택해야합니다. – Gangnus
1/10, 1/20, 1/40, 1/80 ...과 같이 최대 차이가 있다면 마지막 반복의 실제 오류를 1/80로 추측 할 수 있습니다. – Gangnus