html-parsing

    5

    2답변

    일반적으로 내 HTML 구문 분석 요구에 lxml을 사용하지만 Google App Engine에서는 사용할 수 없습니다. 분명한 대안은 BeautifulSoup이지만 잘못된 형식의 HTML에서 너무 쉽게 발견됩니다. 현재 libxml2dom을 테스트 중이며 더 나은 결과를 얻고 있습니다. 어떤 순전히 파이썬 HTML 파서가 가장 잘 수행 되었습니까? 내 우

    3

    1답변

    코드는이 문제를 내가 할 수있는 것보다 훨씬 잘 설명 할 수 있습니다. 나는 또한 이것을 시도한 다른 방법을 포함시켰다. 가능한 경우 이러한 다른 방법이 작동하지 않는 이유를 설명하십시오. 슬프게도 HtmlAgilityPack에 대한 예제가 많지 않습니다. 나는 현재 문서를 통해 더 많은 아이디어를 찾고있다. 내가 알아챈 한 가지는 .nextSibling

    0

    1답변

    아이폰 OS 개발 나는 로컬 "file.html과"파일에서 얻을 문자열로 jQuery과 셀의 이름을 설정해야합니다. HTML을 파싱해야 할 필요가 있음을 알고 있지만 지금은 걱정하지 않습니다. 누군가가 HTML 파일의 첫 번째 텍스트 줄을 설정하고 NSString 변수로 설정하는 간단한 코드를 표시 할 수 있다면 나머지 부분을 파악할 수 있다고 생각합니다.

    2

    5답변

    codeigniter를 사용하고 있습니다. 나는 내가 사용하고있는 PHP 프레임 워크가 중요하지 않다고 생각한다. 하지만 내 자신의 클래스를 작성하기 전에 이미 사용자가 페이지 제목과 메타 태그 (키워드, 설명)를 얻을 수 있도록 작성된 다른 클래스가 있습니다. 그런 종류의 PHP 클래스는 훌륭합니다. 고마워요.

    3

    3답변

    처럼 나는 등 여리고, NekoHtml 같은 다양한 HTML 파서를 사용하여 웹 페이지의 HTML 소스 코드를 분석 자바 프로그램 ... 가 지금은 PHP 언어 파서를 개발하고자 개발 된 PHP의 HTML 파서. 시작하기 전에 html 코드를 파싱하기 위해 PHP와 함께 사용할 수있는 html 파서가 있다는 것을 알고 싶습니다.

    1

    2답변

    PHP DOMDocument를 사용하여 HTML 문서에서 특정 요소의 특정 속성을 찾으려고합니다. 특히, 고유 한 클래스 세트가있는 div가 있으며 그 안에 단일 스팬 만 있습니다. 해당 span 요소의 style 속성을 검색해야합니다. 예 :이 예를 들어 <div class="uniqueClass"><span style="text-align: center

    2

    1답변

    모바일 응용 프로그램을 J2ME에 구축했으며 웹 사이트에서 데이터를 읽습니다. WTK (무선 툴킷)에서는 모든 것이 작동하지만, 모바일 (노키아) 장치의 samen 앱을 테스트하면 다르게 작동합니다. 태그가 표시되지 않지만 다른 유형의 html이 제공됩니다. <hr/> 태그 내가 읽으려고하는 원격 웹 사이트가 다른 클라이언트에 대해 다르게 작동 할 가능성이

    2

    1답변

    HTML Agility Pack을 사용하면 메모장에 붙여 넣은 것과 같은 HTML 결과에서 모든 HTML 특성, 요소 등을 제거 할 수 있습니까? 또한 모든 서식을 제거해야하지만 UL/LI 및 B 태그를 유지해야합니다.

    3

    1답변

    HTML Agility Pack 사용에 대한 자습서를 찾았습니다. 원하는 모든 작업을 수행하는 것처럼 보이지만 그렇게 강력한 도구 인 경우 약간의 잡음이있는 것 같습니다. 인터넷에서. 이 쉽게 정규 표현식을 사용하여 수행 할 수 있지만 우리 모두가 알 public string[] GetTagsByName(string TagName, string Source

    1

    2답변

    웹 사이트에 제 3자가 제공 한 비디오를 원하는 클라이언트가 있습니다. 웹 사이트는 swfobject를 사용하여 비디오를 표시하므로 클라이언트의 웹 사이트에서 작동하도록이를 잡아서 약간 수정하는 것이 가장 쉽다고 생각했습니다. PHP DOMDocument를 사용하는 것 같습니다.하지만 불행히도 제공되는 HTML이 기형적이며 심장 발작을 일으 킵니다. HTM