웹에서 HTML 문서를로드하고 구문 분석하기위한 코드를 작성 중입니다. 내가 지금처럼 JDOM을 사용하고JDOM에서이 URL을로드 할 수없는 이유는 무엇입니까? 브라우저 스푸핑?
는 :
SAXBuilder parser = new SAXBuilder();
Document document = (Document)parser.build("http://www.google.com");
Element rootNode = document.getRootElement();
/* and so on ...*/
그것은 그렇게 잘 작동합니다. 그러나 URL을 "http://www.kijiji.com"과 같은 다른 웹 사이트로 변경하면 parser.build(...)
행이 중지됩니다.
이유가 무엇입니까? Kijiji가 내가 "진짜"웹 브라우저가 아니라는 것을 알고 있기 때문에 wondernig일지도 모른다. 아마도 http 요청을 스푸핑해야 IE처럼 보일 것 같은가?
아이디어가 유용합니다. 감사합니다.
롭
doctypes를 다루는 방법은 일반적으로 사용되는 영구적 인 로컬 캐시를 만드는 것입니다. –