웹 페이지를 구문 분석하여 페이지의 모든 고유 한 문장을 반환합니다. 각 문장은 최소 두 단어로 구성됩니다. 거의 작동합니다. 다음은 페이지에 한 문장으로 표시되지만 내 코드는 <b></b> 태그의 텍스트를 삭제합니다. 굵은 태그 또는 강한 태그와 같은 다른 인라인 스타일의 텍스트가있는 브라우저에 나타나는 문장을 반환하는 인라인 스타일/태그를 제거하려면 어
저는 컴퓨터에있는 HTML 파일에서 테이블 데이터를 추출한 다음 Excel 테이블에 넣을 계획입니다. 이 데이터를 사용하여 데이터베이스에 저장합니다. 내가 붙어있는 유일한 부분은 지금 HTML 파싱이다. 내 코드는 아래와 같습니다. Firefox의 Firebug 확장에서 XPath를 얻었습니다. 당신이 그것을보고 싶다면 Dropbox에 완전한 HTML 파일
HTML 헤더 태그에서 트리 객체 구조를 만드는 가장 좋은 방법은 무엇입니까? <h1>Header 1</h1>
<p>Content under header 1</p>
<h2>H2 for header 1</h2>
<p>Content under H2 for header 1</p>
<h3>H3 for H2 under header 1</h3>
<h4>h
HTML 태그의 모든 속성을 제거하는 방법 그러나 SelectNodes이 작동하지 않을 것으로 보인다 foreach(var eachNode in HtmlDocument.DocumentNode.SelectNodes("//*"))
{
eachNode.Attributes.RemoveAll();
}
UWP 용으로 C#에서 어떻게 작동합니까?
내 양식에 사용자가 웹 사이트로 이동하여 로그인 할 때 사용하는 WebBrowser 컨트롤이 있습니다. 그러면 HAP을 사용하여 가져 오기 위해 XPath 쿼리를 사용할 수 있습니다. 데이터. 일반적으로 물론 WebClient() 세션은 동일한 웹 사이트에서 로그인하지 않는 세션을 시도하므로 필요한 데이터가 노출되지 않습니다. 어떤 제안?
imdb unoffical api "omdbapi"의 정보가 필요합니다. 올바른 링크를 보내고 있지만 응답이 나오면 문서가 null입니다. htmlagiltypack.what을 사용하고 있는데 잘못 했습니까? http://www.omdbapi.com/?i=tt2231253&plot=short&r=xml string url = "http://www.omdb
img 클래스의 클래스 이름은 어떻게 얻을 수 있습니까? <img class="getthis" alt="notthis" src="img/x.gif" />
아래의 코드가 작동하지 않습니다 : HtmlElementCollection classButtones = webBrowser1.Document.All;
foreach (HtmlElement elemen
에 xpath를 얻지 못했습니다.이 코드를 사용하기 전에 웹 사이트의 xpath를 얻을 수 있습니다. 하지만 오늘은 코드를 디버그합니다. 웹 사이트에서 데이터 html을 얻을 수 없습니다. webtruyen.com. 웹 사이트 /robots.txt를 확인하려고합니다. 그러나 의심하지 않습니다. 그리고 프록시를 추가하여 데이터를 얻으려고하지만 데이터를 반환하
위키 피 디아 웹 사이트의 테이블에서 데이터를 긁어 내려고했지만 지금까지 참조 할 노드를 찾았습니다. Wikipedia의 표에는 많은 수의 항목이 있지만 앱을 실행하면 12 개의 결과 만 표시되며 모두 동일합니다. 반환 된 모든 결과는 테이블의 첫 번째 항목과 중복됩니다. 수정 방법에 대한 아이디어가 있으십니까? protected async override
저는 Windows Phone을 배우기 시작한 iOS 개발자입니다. 내 프로젝트는 8 및 8.1을 대상으로하며 HTML 문서를 구문 분석하는 것입니다. HTML을 파싱하는 데 가장 많이 사용되는 HTMLAgilityPack이라는 라이브러리를 발견했지만 8.1 버전에서는 지원되지 않습니다. 그래서 나는 내 HTML 문서를 파싱 할 다른 방법을 찾고 온라인에서