2014-09-07 5 views
-1

는 HTML 파일에서 텍스트를 포함하는 문자열을 가지고 당신이 할 말 :교체 html 태그 (자바)

content = content.replaceAll("<[^>]*>", ""); 

하는 난이 기본적으로 모든 HTML 태그를 제거합니다 알고있다. 그러나 다음과 같이 태그를 유지하려면 :

<> or < (any type/amount of blank space here) > 

이를 수행하기 위해 replaceAll을 수정할 수 있습니까? 그렇다면 어떻게? 모든 의견을 보내 주셔서 감사합니다.

+0

단지 ""] + \\ s * /?> "'는 어떨까요? – sln

답변

3
content = content.replaceAll("<[^>]*[^\\s>][^>]*>", ""); 

적어도 하나의 비 공백 문자가있는 태그와 일치해야합니다.