web-scraping

    0

    2답변

    Tweepy 모듈을 설치하려고하는데 오류가 발생합니다. 다음은 명령 프롬프트에서 내 코드, 여기 pip install tweepy. 내 오류이며, Could not find a version that satisfies the requirement tweepy (from versions:) No matching distribution found for t

    0

    1답변

    웹 페이지에서 데이터를 스크랩하면 일부 요소/값이 반환되지 않습니다. 특히, 나는 rvest 패키지를 사용하여 스크랩합니다. 원하는 정보가 포함 된 웹 페이지는 https://azure.microsoft.com/en-us/pricing/details/virtual-machines/windows/입니다. 그러나 데이터를 스크랩하면 가격이있는 열은 "$ -"만

    -3

    1답변

    웹 페이지의 핵심 텍스트를 가져 오는 데 사용할 수있는 모듈이 있습니까? 뭔가 머리글/메뉴/소셜 링크가 삭제됩니까? 고맙습니다.

    -2

    1답변

    import requests from bs4 import BeautifulSoup import csv url='https://stackoverflow.com/users' response= requests.get(url) html=response.content soup= BeautifulSoup(html, 'html.parser') divs

    0

    1답변

    Facebook 데이터 아카이브 복사본을 다운로드 할 수 있으므로 보유하고있는 모든 개별 채팅의 html 파일을 제공합니다. 추가 분석을 위해이를 데이터 프레임으로 가져올 수 있기를 바랍니다. 파일 중 하나의 예는 다음과 같습니다 내가 여기에 HTML 파일의 예를 업로드 : https://gist.githubusercontent.com/eldenvo/182

    1

    1답변

    저는 토런트 사이트에서 영화 이름과 장르를 수집하기 위해 파이썬으로 스크립트를 작성했습니다. BeautifulSoup은 의사 선택기를 지원하지 않으므로이를 극복 할 기술을 발견했습니다. 내가 지금 직면하고있는 유일한 문제는 아래 스크립트에서 결과를 얻으려면 INVERTED COMMA 내의 텍스트가 정확해야한다는 것입니다. 뭔가 일치하는 부분을 :contai

    2

    4답변

    저는 python으로 일부 요소의 전화 번호와 주소를 가져 오는 스크립트를 작성했습니다. 문제는 내가 전화 번호를 구문 분석하려고 시도한 방식이 확실히 지저분한 것입니다. 나는 주소에 대해서도 똑같이 할 수있다. 그러나 더 깨끗하고 좋은 방법이 있습니까? 데이터가 포함되어있는 내 요소 : 그건 그렇고 (330)971-7456 : from lxml.htm

    -1

    1답변

    방금 ​​셀렌으로 시작했고 작은 문제가 발생했습니다. 기본적으로 클릭 할 때 새 탭에서 열리는 링크를 클릭해야하는 웹 페이지가 있습니다. 그 탭에 대해 몇 가지 작업을하고 그 탭을 닫고 원래의 웹 페이지에서 다른 링크를 클릭하고 싶습니다. 따라와 내 코드입니다 : w.get("https:\link1") opens the given link w.find_el

    0

    2답변

    import requests from bs4 import BeautifulSoup url= requests.get('https://angel.co/companies').text soup= BeautifulSoup(url, 'lxml') for div in soup.find_all("div", class_="name"): print(div

    0

    1답변

    나는 사업 영역 얻을 활용 될 수있다 고용주 ID를, 가지고 : Business Description: Exporters (Whls) Primary Industry:Other Miscellaneous Durable Goods Merchant Wholesalers Related Industry:Sporting and Athlet