2008-09-27 5 views
10

트위터는 search.twitter.com에서 볼 수있는 10 가지 주제를 결정하는 데 어떤 알고리즘을 사용합니까? 그 알고리즘을 구현하고 싶습니다. 또한 가장 인기있는 50 개의 주제 (10 대신)를 보여 드리고 싶습니다. 가장 효율적인 알고리즘을 설명 할 수 있습니까?search.twitter.com의 "인기 주제"알고리즘이란 무엇입니까?

감사합니다. 또한

(Twitters API가 http://apiwiki.twitter.com/REST%20API%20Documentation AT- 찾을 수 있습니다)

, 나는 http://twitter.com/statuses/public_timeline.rss

답변

1

그래서 계산 무엇 트위터 아마 않습니다있는 공공 timeline-을 통해 검색하여 알고리즘을 구현할 수 있도록하고 싶습니다 특정 용어의 언급 수를 뺀 단어 (중지 단어 : do, me, you, I, not, on 등) 그래서 "고양이는 가방에서"나와 "내 강아지는 내 고양이를 먹었습니다" 그 고양이, 개와 가방은 그것이 추출한 용어 일 것입니다 (나머지는 모두 단어를 멈추는 것입니다). 그리고 'cat'을 2 개의 참조로 간주하므로 '고양이'는이 주제에서 유행하는 주제가 될 것입니다 케이스.

12

트렌드 알고리즘은 단순히 키워드의 볼륨이 아닙니다. 그것은 그것의 일부이지만, "저스틴 beiber"가 영원히 최고 트렌드가되지 않도록 붕괴 요인도 있습니다.

이 게시물에 대한 quora이 백업합니다. http://www.quora.com/Trending-Topics-Twitter/What-is-the-basis-of-Twitters-current-Trending-Topics-algorithm?q=trending+algorithm

부식은 일반적으로 알고리즘에서 게시물의 상대적 수명을 사용하여 수행되므로 새로운 항목/게시물/기타에 더 많은 가중치를 부여합니다.

도 참조하십시오. http://www.quora.com/What-tools-algorithms-or-data-structures-would-you-use-to-build-a-Trending-Topics-algorithm-for-a-high-velocity-stream?q=trending+algorithm