2017-12-29 10 views
0

HTML 태그와 그 사이의 모든 것을 포함하는 현재 DOM에서 간단한 한 페이지 HTML 덤프가 필요합니다.DotNetBrowser 컨트롤에로드 된 수정 된 웹 페이지를 어떻게 저장합니까?

나는 SavePageType 변형을 사용해 보았지만 그 중 누구도 내가 원하는 것을하지 않았습니다.

SavePageType.COMPLETE_HTML을 사용하면 html이 엉망으로 만들고 모든 리소스 링크가 변경되어 원하지 않는 리소스가 다운로드됩니다.

SavePageType.MHTML 옵션을 사용할 수 없습니다.

SavePageType.ONLY_HTML을 사용하면 완벽하게 저장되지만 이상한 DOM에 대한 변경 사항은 저장되지 않습니다.

또한 html 요소를 가져 오려고했지만 GetElementByTagName을 찾을 수 없습니다. HTML, 머리 및 본문 태그는 실제로 이상한 태그 안에있는 내용을 제공하더라도 누락됩니다.

DotNetBrowser를 사용하여 문제없이 수정 된 HTML을 캡처하는 방법이 있습니까?

답변

1

여기는 유진입니다. DotNetBrowser를 만든 팀과 함께 일합니다.

제대로 이해했다면로드 한 웹 페이지의 수정 된 HTML 콘텐츠를 저장해야합니다.

이 경우 Browser.GetHTML() 메서드를 사용하여 현재 HTML을 가져온 다음 File.WriteAllText() 메서드를 사용하여 파일에 저장할 수 있습니다. 다음 소스 코드는이를 수행하는 방법을 보여줍니다.

string html = browser.GetHTML(); 
File.WriteAllText("path/to/file.html", html); 
+0

감사합니다. Eugene. 지연 돼서 죄송합니다. 휴일 후에 물건의 진동으로 돌아 가야했다. :) 당신의 솔루션은 완벽하게 작동하는 것 같습니다. 왜 내가 그것을 놓쳤는지 모르겠다. – GrayDwarf