2009-11-02 2 views
6

연구 프로젝트를 위해 지난 3 개월 분의 트위터 메시지를 받고 싶습니다. 기술적 인 문제는 제쳐두고, 이것이 가능한가? 속도 제한 기가 만만치 않게 유지할 수 있도록 느린 폴링 메커니즘을 사용합니까?트위터에서 과거 데이터 얻기

Twitter API는 "클라이언트가 타임 라인 REST API의 페이지 및 카운트 매개 변수를 통해 최대 3,200 개의 상태를 요청할 수 있습니다"라고 말합니다. 시간당 이것입니까? 하루에? 또는 ... 이제까지?

제안 사항? 이론적으로 가능 할까? 이전에 비슷한 것을 한 사람이 있습니까?

감사합니다. Marco

+0

포괄적 인 개요 : https : //gwu-libraries.github.io/sfm-ui/posts/2017-09-14-twitter-data – Nemo

답변

4

트위터는 유명한 "트윗"을 3 주 이상 사용하지 않습니다. 어떤 경우에는 일주일에 한 번만 얻을 수 있습니다. 다음 3 개월 동안 트윗을 저장하는 것이 좋습니다. 많은 사람들은 심지어 그들이 트위터에 의해 지속되고 있는지 의심 스럽습니다.

짹짹이를 찾고 계십니까? 그렇다면 Streaming API의 status/sample 메소드를 확인하십시오. 스트리밍 API는 영구적 인 HTTP 소켓을 사용하여 프로그램하기가 어려울 수 있지만 실제로 작동 시키면 매우 유익합니다. 상태/샘플에서 DB로 짹짹을 덤프하는 작은 스크립트를 설정하는 것이 좋습니다. 며칠 만 지나면 데이터 톤이 있어야합니다.

+3

당신이 오래된 데이터를 얻을 수 없다는 것에 동의하지만 트위터가 모든 마지막 짹짹을 보관하고 있다는 것을 누구도 의심해야한다고 생각하지 않는다. 그렇게하지 않는 것이 정신 나간다. – pents90

+2

'많은 사람들이 트위터에 의해 지속되는 지 의심 스럽습니까? 트윗은 API를 사용하지 않는 3 주 이상의 프로필에도 계속 표시됩니다. 아니면 내가 당신을 오해하고 있습니까? –

+0

@JackNicholson 트윗은 집이나 해시 태그 피드에 표시되는 색인 된 양식은 아니지만 사용할 수 있습니다. – rob

3

검색 API를 사용하여 검색을하지 않고 최대 100 페이지를 반환 한 다음 각 페이지를 1 분에 2 회 (한 번 120 시간 - 속도 제한보다 30 분 미만) 가져올 수 있습니다.). 그러나, 나의 수학이 정확하다면, 그것은 아마도 당신에게 720,000 개의 짹짹 시간을 줄 수 있습니다 ..... 문제는 트위터가 지난 3 개월 동안 약 17 억 5 천만 개의 짹짹을 추가했다는 것입니다. 따라서 수학이 정확하다면 2361 일 또는 6 년이 걸릴 것입니다.

Google 그룹스의 Twitter Development talk에서이 질문을하거나 Twitter에 연락하여 흰색 목록에 올리면 한 시간에 최대 20,000 건의 요청을 할 수 있습니다.

개인적으로 나는 그것이 가능하지 않다고 생각합니다.

+0

그래서이 경우 가능한 한 많은 것을 얻고 덤프되지 않은 예상 비율을 고려해야합니다. 나는 whitelisted입니다. 그래서 이론을 가지고 모든 것을 얻고 싶다면 20 일 정도 걸릴 것입니다. – Marco

+2

검색 API는 6 일에서 8 일 분량의 데이터로만 돌아갑니다. – airportyh

1

DataSift에 트위터 기록 데이터 API가 곧 출시 될 예정이라고 알려 주시면 가입시 here으로 알려드립니다.

0

열쇠 구멍은 xls의 과거 트윗을 표시하거나 시각적 대시 보드에 표시 할 수 있습니다. 미리보기는 가장 최근의 몇 개 트윗 만 샘플링하지만 이메일로 보내면 이력 데이터를 요청할 수 있습니다.

참조 : 당신은 Gnip의 역사 PowerTrack 도구를 사용하여 트위터 역사적인 데이터를 읽을 수

-1

Sifter이라는 회사에서 작성한 서비스를 사용하여 데이터 범위 및 비용을 무료로 예측할 수 있습니다. 데이터에 대한 액세스 권한을 구매하기로 결정한 경우 텍스트 분석 플랫폼 DiscoverText을 통해 제공되며, 검색, 필터링, 중복 제거, 클러스터, 휴먼 코드 및 컴퓨터 분류가 가능합니다.