2012-05-03 5 views
0

과학적 연구를 위해 트위터 연구를 수행하지 않아 트윗이 많이 필요하지 않았습니다.
5 개 언어로 된 약 10 개의 문장이 있으며 실시간으로 일치하지 않습니다. 다른 언어의 트윗을 걸러 내기 위해이 작업을 수행합니다. 5 개 언어 모두에 대해 동일한 양의 트윗을 사용하지 않았습니다. 일부 언어가 너무 많이 표시되어 (예 : 영어) 까다로울 수 있습니다. 게다가, 나는 24 시간 동안 확산 된 데이터를 수집하는 스크립트를 만들지도 않았다. 특정 언어로 된 키워드를 매 15 분마다 100 개의 트윗을 수집하려고 생각했습니다.다국어 키워드와 속도 제한이있는 트위터의 스트리밍 API

나는 실시간으로 짹짹을 수집하기 위해 스트리밍 API를 사용해야 만하지만, 5 개 언어로 짹짹 (15 분당 100 개 트윗으로 제한된 속도)을 수집하고 15 분 동안 확산시킬 수있는 방법을 알고 있습니다. 기간은 하나의 HTTP 요청 인증을 기반으로합니까?

답변

0

node.js를 사용하여 Twitter Streaming API 구현을 살펴보아야합니다. https://github.com/technoweenie/twitter-node

+0

15 분마다 100 개 트윗의 속도 제한으로 구현하는 것이 어려워 보입니다. 특정 키워드가있는 모든 언어에 대해 그래서 총 5 (언어) * 100 (15 분당 짹짹) ​​* 4 (시간당 4 분의 1) = 1 시간에 5 개국 (언어)의 2000 트윗. PHP에서 수정할 수있는 무언가가 없습니까? 또는 각각 1 개의 키워드 언어를 사용하는 5 개의 다른 연결을 만든 다음이 언어를 별도로 제한하는 것과 같은 다른 솔루션이 있습니까? – TRD07

+0

실제로 트위터 노드는 트위터의 스트리밍 API를 사용하고 있습니다. 즉, 모든 트윗을 실시간으로 수신한다는 의미입니다. (필터에 따라) 서버가 새로운 트윗을 사용자에게 밀고 있으므로 많은 요청을하지 않아도됩니다. 나는 그것이 당신이하고 싶은 일을위한 최선의 방법이라고 생각합니다. 이 스트리밍 API에 대한 자세한 내용은 https://dev.twitter.com/docs/streaming-api에서 확인할 수 있습니다. – Antoine