2008-09-19 6 views
21

어느 하나가 이전에이 작업을 수행 했습니까? 웹 서비스가 있어야하지만 찾을 수는없는 것처럼 보일 것입니다. IMDB에서 기본 정보 만 보여주는 개인용 응용 프로그램을 작성 중입니다.IMDB에 연결

답변

14

사용할 수있는 웹 서비스가 없습니다.

그러나 사용자의 요구에 맞게 모든 언어로 작성된 충분한 HTML 스크레이퍼가 있습니다!

몇 개인 프로젝트에서 .NET 3.5 Imdb Services opensource project을 사용했습니다.

1 분 구글 결과 :

+0

감사합니다. 저는 대학에서 프로젝트를 단순화하기 위해 이것을 찾고 있습니다 :) – nXqd

8

이 포함 plain-text data files의 집합입니다 감독, 영화 등의 형식 목록. 누군가가 공개하지 않으면 자신의 파서를 작성해야 할 가능성이 높습니다. 귀하의 언어에 대한 e. "imdb api"및 "imdb parser"와 같은 Google 검색을 시도하십시오.

화면 스크레이퍼가 유용 할 수 있지만 사용상 특히 prohibit scrapers입니다.

+0

스크래퍼를 사용하는 것이 금지되어 있다는 사실을 완전히 고치지 만 개인적인 용도로만 사용하기 때문에 나는 "쇼 스토퍼". –

4

IMDB는 스크래퍼를 금지하고 페이지 레이아웃을 매번 변경하기 때문에 HTML 구문 분석이 옵션이지만 일년에 2-3 회 코드를 조정할 준비가되어 있습니다 (포기 해 버렸습니다.). 그들은 데이터에 대한 완전한 액세스 권한을 부여하는 유료 서비스를 제공하지만, 무엇이 필요한지 설명하고 경쟁 웹 사이트를 구축하지 않는다고 확신시켜야합니다 (링크가 있는데, 바뀌었고 지금 찾을 수 없다). - http://www.trynt.com/trynt-movie-imdb-api/에서 자신의 사이트를 체크 아웃

private const string UglyMovieRegex = "(?<=5>|3>)(Cast|Director:|Fun\\sStuff|Genre:|Plot:|Runtime:|Tagline:|Writers:)" 
               + "|href=\"[\\w\\d/]+?(Genres|name|character)/([\\w]+?)/\".*?>([.\\-\\s\\w]+)</a>" 
               + "|(?<=h\\d>)([.\\w\\s'\\-\"]+)(?=<a\\sc|</d|\\|)"; 

Regex MovieData = new Regex (UglyMovieRegex, RegexOptions.Compiled | RegexOptions.Multiline | RegexOptions.Singleline); 
+0

안녕하세요, 저는 왜 imdb가 webscraping을 허용하지 않는지 이해하지 못합니다.하지만 그들에게 완전한 데이터에 대한 완전한 액세스 권한을 부여합니까? 그 이유를 아십니까? 웹 스크래핑은 이미 제공 한 사이트에서 데이터를 가져 오는 것만으로도 이해가되지 않습니까? – hlim

5

여기에 정규식을 사용하여 내 자신의 솔루션입니다. 그들은 또한 텔레비전 데이터에 대한 별도의 서비스를 제공합니다.

1

TRYNT 중공업 테크놀로지 (무료)를 제공 기본 IMDB 데이터를 검색하기위한 웹 서비스 :

+0

Trynt 죽었습니까? 지금은 며칠간 추락했습니다. –

+0

운이 없음, 서버가 다운되었습니다! – jv42

2

또 다른 대안은 로컬 컴퓨터에서 IMDB 데이터베이스를 실행하는 것입니다. Java Movie Database은 IMDB 데이터베이스 파일을 가져 와서 변환하고 IMDB의 로컬 액세스 가능 복사본을 제공합니다. IMDB에는 Java Movie Database에는없는 기능이 있습니다. 그러나 원하는 경우 모든 데이터에 빠르게 액세스 할 수 있다면이 기능을 사용해 볼 가치가 있습니다.

17

IMDb의 라이브러리는 현재 매우 신뢰할 만하지 못하고 매우 비효율적 인 것처럼 보입니다. 나는 정말로 IMDb가 단지 웹 서비스를 만들길 바란다.

약간의 검색 후 IMDb에 대한 합리적인 대안을 찾았습니다. 개요, 연도, 등급, 포스터, 예고편 등과 같은 모든 기본 정보를 제공합니다. :

The Movie Database (TMDb).

웹 서비스는 wrappers for several languages으로 제공되며 지금까지는 신뢰할만한 것으로 보입니다. 검색 결과는 나 자신을 위해 더 정확합니다.이 비록

5

여기에 간단한 파이썬 코드

import urllib2 

movie_id = raw_input('Enter the ID of the movie: ') 
json = urllib2.urlopen('http://imdbapi.com/?i=' + movie_id + '&r=json') 

print json.read() 

가 imdb.py로 저장하고 다음

는 XML 데이터를 원하는 경우 쉘 또는 터미널 또는 무엇이든 같이 실행 2 년 이상 전에 게시 그냥 json을 xml로 바꿉니다.

imdbapi.com 웹 사이트에서 json 결과를 반환하면 더 많은 옵션을 볼 수 있습니다.