2
작업 및 세션을 저장하는 쿠키를 지원하는 크롤러를 작성하고 싶습니다. java headless 브라우저에는 두 가지 구현이 있습니다. HtmlUnit은 javascript 및 html 구문 분석을 지원합니다. 그러나 크롤러의 성능을 위해 HttpUnit을 사용하는 이유가 있습니까?HtmlUnit 대 HttpUnit의 성능 비교
작업 및 세션을 저장하는 쿠키를 지원하는 크롤러를 작성하고 싶습니다. java headless 브라우저에는 두 가지 구현이 있습니다. HtmlUnit은 javascript 및 html 구문 분석을 지원합니다. 그러나 크롤러의 성능을 위해 HttpUnit을 사용하는 이유가 있습니까?HtmlUnit 대 HttpUnit의 성능 비교
HtmlUnit 개발자 중 한 명이 관련 문서 here입니다.
기본적으로 Javascript 지원을 제외하고 HtmlUnit은 HttpUnit보다 높은 수준이라고합니다. HtmlUnit은 또한보다 적극적으로 개발 된 것 같습니다 (2014 년에 2 개의 릴리스가 있고 2008 년 이후 HttpUnit이 업데이트되지 않았습니다).
[cockies] (http://www.urbandictionary.com/define.php?term=cockie) LOL :) 오타와에 조심해 –
나는 성능 비교를 찾을 수 있을지 의심 스럽다. 그것들은 속도를 위해 최적화되지 않았습니다 : 그들의 목표는 주로 최고 성능을 필요로하지 않는 단위 테스트를 구현하는 것입니다. 혼자서 측정 할 수는 있지만 네트워크가 Java 코드가 아니라 병목 현상이 될 것입니다. –
광산의 응용 프로그램에 HTMLUnit을 사용하고 있습니다. 기본적으로 CSS를 사용하지 않도록 설정하고 소스에서 Java 애플릿과 ActiveX를 제거하여 구현을 가속화했습니다. – Lee