0

정보 검색에서 몇 가지 작업을 수행하고 있으며 시험을 치러야하고 전적으로 단서가 없습니다. 첫째, 누가 정보 검색에서 실제로 PageRank가 가능한지에 대해 가능한 가장 짧고 최상의 설명을 추천 해 줄 수 있습니까? 어쩌면 좋은 짧은 비디오 또는 자신의 설명. Google에서 사용했거나 사용했는지 알고 있습니다.정보 검색 - Adjancey 행렬 그래프 스케치, 순간 이동 확률, PageRank 계산

여기에 많은 질문이 있다는 것을 알고 있지만 가능한 한 짧은 시간 내에 많은 도움을 줄 수 있습니다.

그래서 내 첫 번째 질문은 (과거 논문에서 가져온, 그리고 내 자신의 사례를 만드는) :

A B C 
A 0 1 0 
B 1 0 1 
C 0 0 0 

그리고 그래프를 만들 : 내가 같은 테이블을 걸려 라

. enter image description here

그리고 같은 그래프가 주어 경우 : enter image description here

표는 것 난이 (내가 "예 맞습니다이다"또는 "아니오"사용할 수있는 올바른 있지만 확실 믿습니다 :?

A B C 
A 0 1 0 
B 0 0 1 
C 0 0 0 

, 내가 도움을받을 얻을하시기 바랍니다 수없는 경우 올바른가 어딘가에 설명인가요 내가 읽고있다 강의는 설명에 크지 않다 나의 강사 중 하나를 돕는 크지 않다

,536,913.

다음 첫 번째 표에는 순간 이동 확률을 사용하라는 메시지가 표시됩니다. 확률 (특별한 기호) = 1/2라면, 이것은 0x1/2와 같은 테이블에있는 0을 포함하여 모든 것을 곱하는 것을 의미합니까? 또한 1x1/2? 이것은 전이 확률 행렬에 대한 것입니다.

다음은 어떻게 위의 행렬에서 PageRank를 계산할 수 있습니까? 행렬 곱셈 사용. 단어 또는 Pseudocode.

내가 알고 싶은 또 다른 질문은 사용자가 다른 사용자를 따라 가면 트위터의 사용자 순위가 올라갈 것입니까? 나는 그들이 다시 사용자를 따르지 않기 때문에 이것이 아니오라고 가정하고 있었습니까?

사용자의 페이지 랭크는 임의의 사용자로 시작하여 다른 임의의 개인 설정을 클릭하면 찾을 수있을 때까지 사용자를 얼마나 자주 찾습니까? 나는이 것이 사실이 아님을 분명히 추측한다. 해당 사용자가 상기 사용자를 따르지 않을 수 있기 때문입니다.

나는 이것이 많이 묻는다는 것을 알고있다. 누구나 내가 할 수있는 튜토리얼을 가지고 있지 않은가? 그것은 복잡하지 않으며 나는 그것을보고 마스터 할 수있다.

감사합니다. 정말로 감사드립니다. 나는 한 사람이 그들 모두에게 대답 할 수는 없지만 어떤 사람들에게는 도움을 줄 수 있다는 것을 알고 있습니다.

답변

0

여기에 귀하의 질문에 대답에 내 찔린입니다 :

좋은 학습 자원 : http://en.wikipedia.org/wiki/PageRank#Simplified_algorithm (의심 할 여지없이 당신이 이미 그것을보고했지만, 그것은 꽤 좋은 일이다). 먼저 시작하여 알고리즘을 먼저 이해한 다음 구현을 수행하십시오.

구현하기 좋은 간단한 방법일까요? http://pr.efactory.de/e-pagerank-algorithm.shtml

나이 : http://networkx.lanl.gov/reference/generated/networkx.algorithms.link_analysis.pagerank_alg.pagerank.html : 난 당신이 파이썬 (일반 학교 언어)에서 프로그램 할 수 있습니다 같은데요 http://www.cs.princeton.edu/~chazelle/courses/BIB/pagerank.htm

,이 경우 당신은 페이지 랭크 (PageRank) 계산을 가지고 그래프를 처리하기위한 패키지에 관심이있을 수 있습니다. 자신 만의 페이지 랭크 알고리즘 (매우 무언가)을 작성해야한다면, 그것을 사용하여 결과를 확인할 수 있습니다.

매트릭스 -> 그래프 변환 질문 : 교수님은 방향성이 매트릭스에 인코딩되는 방법을 지정해야합니다. B, C에서 1은 B에서 C 또는 C에서 B로 링크를 지정합니까? 내 추측은 B에서 C가 될 것입니다. 사실이라면 첫 번째 그래프는 잘못되었지만 두 번째 그래프는 괜찮습니다. Directionality는 PageRank에서 매우 중요합니다.

필자는 순간 이동 가능성이 새로운 단계를 실행하는 임의의 워커가 그래프의 임의의 노드로 이동할 확률이라고 생각합니다. 위키 피 디아 페이지의 "damping factor"에 있습니다. 매트릭스에서 숫자를 곱하는 것과 어떻게 관련이 있는지 모르겠습니다.

트위터 질문에 대해서는 네가 맞다고 생각한다. 두 번째 사람과 연결 (또는 추측하는 경우)하면 첫 번째 사람의 PageRank에는 아무 것도 직접하지 않지만 두 번째 사람의 PageRank를 늘릴 가능성이 높습니다. 실제로, 두 번째 사람이 첫 번째 사람이 흥미 롭다는 사실을 알아 차리고 따라 다니는 것처럼 두 번째 효과가있을 수 있습니다.

마지막 질문까지 - 예, 페이지 랭크 알고리즘의 한 공식은 페이지 랭크 (pagerank)로 들어가는 노드 (페이지)를 만나는 빈도와 링크를 따라 무작위로 걷는 것과 같습니다.

행운을 빈다!

+0

나는 이와 관련하여 또 다른 질문이 있습니다! 그것은 Topic PageRank와 관련되어 있습니다. 묻는다면 도움을 줄 수 있습니까? –