data-harvest

    1

    4답변

    내 사이트에서 데이터 수확을 막고 싶습니다 (물론 GoogleBot 제외). GB의 UserAgent에 의존하는 것으로 추측하고 있습니다 (모든 봇이 위조 할 수 있습니다) 가짜를 피하기 위해 GoogleBot을 인증하려면 어떻게해야합니까?

    0

    1답변

    원격 json 소스에서 수확하기 위해 ckanext-dcat을 사용했습니다. 일부 수확 작업이 완료되지 않았고 해당 소스의 모든 데이터 세트와 함께 삭제해야하는 경우가 있습니다. convinient하지만 모두 정상으로 돌아 가면, 단 하나의 작업 만 삭제할 수있는 방법이 있는지 모르겠습니다. 하지만 지금이에서 얻을 소비자 로그 수집 : Traceback (

    0

    3답변

    대부분의 가장 큰 뉴스 출처에서 뉴스 기사를 크롤링 할 표준/API가 있는지 아는 사람이 있습니까? 저는 색인을 생성하기 위해 rss를 사용하고 있습니다. 그러나 나는 그것들을 단지 그들의 제목보다 더 많은 자료로 분류하고 싶습니다.

    0

    1답변

    데이터 위젯에서 값을 (또한 XML 및 selectr를 사용하여 시도) 검색 없지만, 나는 다음과 같은 문제와 가진 어려움입니다 : 브라우저의 웹 관리자의 을 html로 보이는 <span data-widget="turboBinary_tradologic1_rate" class="widgetPlaceholder widgetRate rate-down">1226.