2016-08-16 7 views
1

나는 python (xbmc/kodi)을 통해 자바 스크립트 달력 페이지의 섹션을 긁어 내려고하고있다. 지금까지 정적 HTML 변수를 긁을 수 있었지만 JavaScript 생성 섹션은 고칠 수 없었습니다.XBMC (Python) 문제의 간단한 로그인 기능

검색하려는 변수가 <strong class="item-title">**this**</strong> , <span class="item-daterange">**this**</span> and <div class="item-location">**this**</div>입니다.이 변수는 HTML 소스의 별도 섹션에 있으며 JavaScript를 통해 렌더링됩니다. 모두 스크랩 된 변수는 하나의 문자열에 추가되어 표시되어야합니다.

정규식 위부터
response = net.http_GET('my URL') 
    link = response.content 
    match=re.compile('<strong class="gcf-item-title">(.+?)</strong>').findall(link) 
    for name in match: 
     name = name 
     print name 

나는 그 변수의 한을 긁어 수와 내가 함께 모든 변수의 표시 될 문자열 목록이 필요하기 때문에, 어떻게이 수행 할 수 있습니다?

나는 페이지가 자바 스크립트 변수가 긁힐 수 있도록 미리 렌더링되어야한다. 그러나 xbmc를 사용하고 있기 때문에 dryscrape와 같은 추가 파이썬 라이브러리를 가져올 수 있는지 확실하지 않다. Dryscrape를 다운로드하면 setup.py, init .py 파일이 제공되지만 다른 파일과 함께 사용하려면 어떻게해야합니까?

감사합니다.

답변

1

JavaScript를 다룰 단계, XBMC/Kodi에서 Python을 사용하는 방법 또는 setup.py 파일과 함께 제공되는 패키지를 설치하는 방법에 대해 궁금한 점이 있습니까? 당신이 당신의 재 패턴입니다 일치을받지 않습니다 항상 <strong class="item-title">**this**</strong>처럼 항목이 클래스 = "GCF 항목 제목와 요소 인 경우

다만, 위의 정규식을 기반으로.

BeautifulSoup을 사용하거나 사용하고 있습니까? 사용하지 않고 있지만 할 수있는 경우, 웹 사이트를 긁어 모으는 데 인생이 바뀝니다.

+0

예, Beautifulsoup을 사용하고 있으며 3 개의 div 그 하나의 문자열에 추가해야하고 인쇄, 그 3 div의 (강한 텍스트 포함) 질문에 언급 된, 그들은 자바 스크립트를 통해 생성됩니다, 어떻게 내가 이것을 얻을 수있는 아이디어? 나는 Beautifulsoup을 사용할 수 있지만 다른 어떤 것은 사용할 수 없습니다. –

+0

그리고 xbmc와 함께 setup.py 파일과 함께 제공되는 패키지를 어떻게 사용합니까? 나는 그것을하는 방법에 대한 답변을 찾지 못했습니다. –

+0

도움이되는지 확인하려면 [이 링크] (http://kodi.wiki/view/Python_libraries)를 확인하십시오. Kodi/XBMC는 _init_.py 파일을 ** lib ** 폴더에 두어'from lib import '접근법을 사용하기를 원합니다. – dblclik