에게 상황을 이용하여 HTML 내용의 절대 URL을 상대 URL로 앵커 태그를 변환 : : 우리는 서버 A. 문제를에 줄에 서버 B의 내용을 표시 할 서버 A에 서버 B의 내용에 하이퍼 링크의 일부는 다음과 같은같은 앵커 태그가 포함 된 HTML 코드 블록을 감안할 때 서버 A. 에 표시 될 때이를 유효하게 서버 B를 기준으로합니다 <a href="/som
화이트리스트에없는 html 태그 및 속성을 제거하는 기능을 만들려고합니다. 내가 tryig 달성하고있는 출력 <b>first text </b>
<b>second text here
some text here
some text here
</b>
some twxt here
입니다 static List<string> WhiteNodeList
나는 Erlang에 아주 익숙하며 학습 연습의 일환으로 Erlang에 HTML 파서를 작성하고 싶다. 추출 할 데이터를 설명하는 패턴을 사용하여 웹 페이지에서 특정 값을 추출하고 싶습니다. 누구나 얼랭 (Erlang)에서이 문제에 접근하는 방법에 대한 높은 수준의 조언을 제공 할 수 있습니까? 문서를 토큰 스택으로 바꾸어서 유한 상태 시스템을 사용하여 중첩
XQuery를 사용하여 HTML 페이지에서 내용을 추출하고 있습니다. 아래와 <td>
<a href ="hw1">xyz </a>
Hello world 1
<a href="hw2">Helloworld 2</a>
Helloworld 3
</td>
텍스트를 추출하는 제 XQuery 식 그대로 : //a[st
xhtml 파일을 구문 분석하고 UITableView에 표시하려고합니다. xhtml 파일을 구문 분석하여 브라우저에 표시되는 것처럼 표시 할 수있는 가장 좋은 방법은 무엇입니까? 다음은 샘플 xhtml 소스입니다. <?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML
HTML 파일을로드하고 구문 분석하기 위해 Jsoup라는 HTML 파서를 사용하고 있습니다. 문제는 내가 긁고있는 웹 페이지가 ISO-8859-1 문자 집합으로 인코딩되어 있고 Android가 UTF-8 인코딩 (?)을 사용하고 있다는 것입니다. 이것은 일부 문자가 물음표로 나타나는 결과입니다. 그래서 이제 문자열을 UTF-8 형식으로 변환해야합니다. 이제