html-parsing

    -3

    2답변

    나는 정말 많은 오프라인 html 파일을 가지고 있으며 이름, 주소 등을 얻어야합니다. 그리고 CSV를 만드십시오. 내가 어떻게 더 나은 방법이있을 생각 ...이 for /r %%i in (*) DO ( findstr /o "name" %%i >> results.txt ECHO ; >> results.txt findstr /o "

    1

    1답변

    Codeigniter를 처음 사용했습니다. 내가 양식에 대한 템플릿을 생성하고보기 파일 내에서 그것을 분석하고 싶습니다. 그것은 구문 분석하지만 그것은 페이지의 상단에있는 구문 분석 된 양식을 에코합니다. 전체 페이지에 템플릿을 사용하고 있지 않습니다. 파서를 사용하여 페이지의 평화를 표현하고 싶습니다. 여기 내 파서 : <form action = {act

    0

    2답변

    줄 단위로 검색하고 특정 문자열을 찾은 다음 그에 따라 몇 가지 작업을 수행해야하는 html 파일이 있습니다. 문제는 문자열이 html 파일의 각 행의 전체 행과 일치한다는 것입니다. 주어진 줄에 실제 문자열 앞에 공백이 있으면 양수 여야 함에도 불구하고 일치 항목이 거짓으로 판명됩니다. 위의 내 코드에서 package read_txt; import j

    2

    2답변

    메타 태그의 콘텐츠를 가져 오려고합니다. 문제는 BS4가 태그가 제대로 닫히지 않는 일부 사이트에서 BS4가 태그를 제대로 구문 분석 할 수 없다는 것입니다. 아래 예제처럼 태그를 사용하면 스크립트의 링크와 같은 다른 태그를 포함하여 복잡한 함수가 출력됩니다. 브라우저가 메타 태그를 자동으로 닫고 BS4가 혼란 스럽습니다. 내 코드는 작동 : <meta n

    0

    1답변

    API에서 row 및 columns 데이터가있는 html 테이블 데이터를 검색하여 다른 팀에 채워야합니다. 위의 코드의 format = html2text.HTML2Text() format.ignore_links = True format.bypass_tables = False #format.ignore_tables = True format.wrap_l

    1

    2답변

    나는 rvest를 사용하여 http://www.basketball-reference.com/teams/CHI/2015.html에서 긁어 모으려고합니다. selectorgadget을 사용하여 원하는 테이블에 대한 #advanced 태그를 찾았습니다. 그러나, 나는 그것을 알아 차리지 못하고있는 것으로 나타났습니다. 페이지 소스를 보면 테이블이 html 주석

    0

    2답변

    내가 이런 HTML의 조각이있을 때 목록 요소를 가져옵니다 : <li class="myclass"> <ul class="myclass2"> <li><span>Name1</span><span>Value1</span></li><li><span>Name2</span><span>Value2</span></li><li><span>Name3

    0

    1답변

    페이지 내의 특정 링크를 검색하기 위해 HTML 문서를 구문 분석하려고합니다. 이 방법이 최선의 방법은 아닐지 모르지만 HTML 문서가 필요한 내부 노드를 찾으려고합니다. 그러나 HTML에서 두 곳의 인스턴스 (바닥 글과 탐색 모음)가 발생합니다. 내비게이션 막대에서 링크가 필요합니다. HTML의 "바닥 글"이 먼저옵니다. 여기 내 코드는 다음과 같습니다.

    1

    2답변

    에서 입력 태그에서 값을 얻을 수 있습니다 : <input type="hidden" name="myname" id="myid" value='myvalue' /> 어떻게 HTML 민첩성 팩을 사용하여이 입력에서 myvalue받을 수 있나요? 저는 C# 및 HTML 민첩성 팩을 사용하고 있습니다. 나는 이것을 시도했다 : var latlon = mydeta

    2

    1답변

    Java의 웹 페이지에서 HTML 요소를 구문 분석하고 양식을 작성하여 제출하여 로그인을 시뮬레이트해야합니다. 저는 약간의 연구를 해왔습니다. 여기에 jsoup 라이브러리를 사용했습니다. 그러나 이것을 구현 한 후 jsoup은 구문 분석 용이며 버튼 클릭을 수행 할 수 없다는 것을 깨달았습니다. 이 예에서는 submitButton 요소를 클릭해야합니다. t