웹 페이지와 상호 작용하기 위해 Selenium 2 Java API를 사용하고 있습니다. 내 질문은 : 링크 대상의 콘텐츠 형식을 어떻게 검색 할 수 있습니까?셀렌 2 : 링크 대상의 컨텐츠 유형 감지
기본적으로 배경입니다. 링크를 클릭하기 전에 응답이 HTML 파일인지 확인하고 싶습니다. 그렇지 않다면 다른 방식으로 처리해야합니다. PDF 파일의 다운로드 링크가 있다고 가정 해 봅시다. 응용 프로그램은 브라우저에서 열지 않고 해당 URL의 내용을 직접 읽어야합니다.
목표는 현재 위치가 HTML, PDF, XML 또는 적절한 파서를 사용하여 문서에서 유용한 정보를 추출하는 것을 자동으로 알 수있는 응용 프로그램을 만드는 것입니다.
업데이트
추가 현상금 : 나에게 주어진 URL의 내용 유형을 얻을 수있는 최적의 솔루션으로 갚아 주실 것이다.
고마워, 나는 그것을 밖으로 시도 할 것이다. – Alp
코드 조각에 문제가 있습니다. 엔티티는 응답이 ok 인 경우에도 항상 null입니다. – Alp
HttpHead 응답에'HttpEntity'가 포함되지 않았을 수 있습니다. 이 예제를 응답에서 Content-type 헤더를 가져 오도록 변경했습니다. 아직 테스트되지 않았습니다. –