0
제목, HTML 본문 (일반 텍스트), HTML 페이지에서 이미지 URL을 추출하고 싶습니다. Apache Tika 서버를 사용하여 가능합니다.Apache tika 파서로 HTML에서 제목, 본문 및 이미지를 추출하는 방법
당신은 당신에게 사용할 수있는 몇 가지 선택을 한 단계로, 당신은 몸 일반 텍스트 및 모든 img
태그의 src URL을 모두 얻을 수있는대로 - 아파치 티카 서버를 사용하여
Tika - 앱을 어떻게 사용하고 있습니까? 섬기는 사람? 자바 외관? 파서가 직접? html로 어떤 본문을 원하는가요? 일반 텍스트? 이미지로 무엇을하고 싶습니까? 그들이 어디에 있는지 알아? – Gagravarr
전 신체 일반 텍스트 및 이미지 URL을 가져오고 싶습니다. 이미지를 다운로드하거나 저장할 필요가 없습니다. – bertyuan