2014-01-06 2 views
0

웹 페이지 용 웹 콘텐츠를 검색하는 데 gui-less 브라우저 htmlunits를 사용하고 있으며 코드는 "http://www.xyzzzzzzz.com.sg/"을 제외한 다른 사이트에서 정상적으로 작동합니다. 아무도 이것이 왜 일어나는지 설명 할 수 있습니까 ???? 저는 이미 세 개의 브라우저 인 Chrome, FIREFOX 및 IE에 대해 BrowserVersion으로 HtmlUnit webdriver를 사용했지만 아무 것도 작동하지 않습니다.다른 URL에 대한 특정 URL에 대해 htmlunit을 통해 해당 웹 사이트를 다운로드 할 수 없습니다.

public class Test{ 

    public static void main(String[] args) throws Exception { 

     String url = "http://www.xyzzzzzzz.com.sg/"; 

     WebClient webClient = new WebClient(BrowserVersion.CHROME); 
     webClient.getOptions().setCssEnabled(false); 
     webClient.getOptions().setThrowExceptionOnFailingStatusCode(false); 
     webClient.getOptions().setThrowExceptionOnScriptError(false); 
     webClient.getCookieManager().setCookiesEnabled(true); 
     webClient.getOptions().setUseInsecureSSL(true); 

     HtmlPage currentPage = (HtmlPage) webClient.getPage(url); 
     String content = currentPage.asXml(); 
     webClient.waitForBackgroundJavaScript(20000); 

     System.out.println(content); // NOT SHOWING PROPER CONTECT 
    } 
} 
+0

많은 연구를 통해 많은 옵션을 시도했습니다. HtmlClient를 사용하면 416 오류가 발생하지만 브라우저에서는 정상적으로 작동하므로 HtmlUnit을 사용하고 있습니다. 어떤 해결책을 제안하십시오 – Shashank

답변

0

택시 당신은 내가 코드에서 몇 가지 실수가 있다고 생각 DNT 올바른 CONTECT.Because 표시되지 뜻 않는 것을 설명하시기 바랍니다. JS가 실행을 위해 HtmlUnit에 문제가 있으므로 잠시 중단하여 확인하십시오.

+0

plz 코드의 url 언급에서 jobstreet로 xyzzzzzz를 바꾸십시오. 그러면 SOP가 인쇄하고있는 내용이 사이트에서 사용 가능한 내용과 동일하지 않다는 것을 알게 될 것입니다. – Shashank