2013-12-23 4 views
1

나는 twitter api에 익숙하지 않으며 이것을 이해하려고 노력하는 데 엄청난 시간을 소비합니다.Twitter API를 사용하여 해시 태그 검색하기

가장 최근의 트윗에서 주어진 검색어에 대해 많은 수의 (100k - 1m) 트윗을 추출하고 싶습니다. tweepy로 작업을 시도했지만 스트림을 설정할 수 있었지만 과거의 데이터도 필요합니다.

또한 다음 코드를 시도했지만 한 번에 100 개만 제공하며 since_id 및 max_id를 사용하여 지난 트윗을 실행하는 방법을 이해할 수 없습니다. 또한 누군가가 게시물에서 해시 태그를 추출하는 방법을 알고 있다면. 현재 게시물에서 단어를 분리하고 "#"으로 단어를 찾고 있지만 api.search 속성에 '해시'이 있는데 어떻게 호출해야하는지 잘 모르겠습니다.

results = api.search(q=movies[0],count=100,lang='en') 

모든 지침을 제공합니다.

+1

Twitter API로는 간단하게 할 수 없습니다. 주어진 쿼리는 최대 3200 개의 트윗 (최대 100 개 항목)을 반환하도록 제한됩니다. – alko

+0

스트림을 열어서 앉아도? 내가 스트리밍 할 수있는 양에는 제한이 있습니까? 또한 다른 방법을 통해 그 주위에 방법이 있습니까? – Sohail

+0

아니요, 스트림은 무제한입니다.하지만 "과거 데이터도 필요합니다."라고 말하면 검색은 유일한 옵션입니다. – alko

답변

0

Tweepy Cursor를 사용하는 것이 좋습니다. 하는 커서를 만들 그것에게 API 메소드를 전달하고, 매개 변수하려면 다음

cursor = tweepy.Cursor(api.search, q=movies[0], count=100, lang='en')

를, 커서의 items 메소드에 의해 반환되는 결과를 반복. 당신은 결과의 선택적 제한에 전달할 수 있습니다

for item in cursor.items(limit=20): # the limit can be omitted 
    # do something with the item 
+0

특정 해시 태그에 대한 트윗 수를 얻을 수 있습니까? –

0

총 아카이브 3200 짹짹로 제한되어 있지만, 당신은 수행하여 result[]이를 추가 할 수 있습니다 1500

0

의 일일 제한이 :

results = [] 
#Get the first 1000 items based on the search query and store it 
for tweet in tweepy.Cursor(api.search, q='%23Trump').items(1000): 
    results.append(tweet)