scrape

    0

    1답변

    나는 octoparse 및 유사한 소프트웨어에서 작동하는 XPath 기술을 얻으려고 애 쓰고 있습니다. 나는 지금 여기에서 독서 지위로부터의 google 장을 시험하고 있고, 어느 쪽이라도 일하게 할 수 없다. 입력하십시오 slideshare 프레젠테이션 URL (예 : https://www.slideshare.net/carologic/ai-and-mach

    -1

    1답변

    나는 이것을 golang package 웹 사이트 이미지를 긁어 내기 위해 사용해 보려고합니다. 이것은 내가 고칠 필요가있는 html 노드입니다. <ul class="list clearfix"> <li> <div> <a href=www.example.com/asda"> <img src="..sadsada./ssa/3.

    -3

    2답변

    17k URL 하이퍼 링크 목록이있는 Excel 시트가 있습니다. 각 링크를 클릭하고 결과 웹 페이지의 데이터를 Excel 시트로 스크랩하는 작업을 자동화해야합니다. OSX에서 Mac에서이 작업을 수행하는 가장 좋은 방법은 무엇입니까?

    0

    1답변

    로컬 폴더 중 하나에있는 html 파일 인 "웹 사이트"를 다듬어야하는이 프로젝트에서 작업합니다. 어쨌든, 나는 각 학생 객체에 대한 앵커 태그의 href 값 (URL)으로 긁어 내려고 노력했습니다. 나는 또한 다른 일을 위해 긁어 모으고 있으므로 나머지는 무시하십시오. 여기에 지금까지 무엇을 가지고 : 여기 def self.scrape_index_page

    0

    1답변

    인기있는 옥션 웹 서비스에서 Goutte 목록을 통해 근근히 다가 가려고하지만 코드 조각은 javascript로 렌더링되며 문제는 Goutte가 JS 작업없이 DOM 만 반환한다는 것입니다. 교향곡이 헤드리스 브라우저라면 전체 내용이 렌더링 될 때까지 긁어 모으기를 기다리는 것이 좋을까요? 나는 정상 phantomjs을 확인,하지만 난 Goute에서 그 능

    0

    1답변

    웹 페이지의 다음 페이지를 긁어 내려고합니다. 총 20 페이지입니다. 첫 페이지의 URL을 사용하여 다음 페이지를 긁어 내고 싶습니다. 코드 : b=[] url="https://abcde.com/cate6-%E7%BE%8E%E5%A6%9D%E4%BF%9D%E9%A4%8A/" res=requests.get(url) soup = BeautifulSoup(

    0

    1답변

    Google 제품에서 importxml을 사용하여 모든 제품의 제품 세부 정보를 다 써야합니다. 제품 페이지 링크를 추출하는 데 문제가 있습니다. 은 아래의 쿼리를 사용하려고 =importxml("http://au.boohoo.com/womens/dresses/new-in","//div[@class='thumb-link']/@href") 내가 점점 계속 모

    0

    2답변

    로그인 상태의 페이지를 긁어 내기 위해 mechanize gem을 사용하려고합니다. 그러나 내가 사용하고있는 사이트의 경우 html에서 사용자 이름이나 암호 필드의 이름을 지정하지 않습니다. Mechanize 문서를 검색했지만 필자는 필드 이름을 사용하지 않고 입력란에 텍스트를 입력하는 코드를 작성할 수 없습니다. 페이지 또는 첫 번째 텍스트 상자에서 다섯

    0

    1답변

    Etsy 용 스 크레이퍼를 코딩하고 있습니다. 스팬을 검토 할 때 올바른 출력을 얻습니다. 그러나 가격으로 스팬을 마구 뽑으면 나에게 단 하나의 가치 만 부여되며 이유는 알 수 없습니다. 누군가가 도울 수 있다면, 좋을 것입니다! <div class="v2-listing-card__info"> <p class="text-gray text-truncate

    0

    1답변

    URL 페이지의 모든 주석을 긁어서 텍스트를 txt 파일 (1 개의 주석 = 1 개의 txt)에 저장합니다. 코멘트의 텍스트에 이모티가있을 때 문제가 있습니다. 사실, 프로그램이 멈추고 "UnicodeEncodeError : 'charmap'코덱이 문자를 인코딩 할 수 없다고 말합니다. 이 문제를 어떻게 해결할 수 있습니까? 코드의 구조를 (내가 BS4를