2011-01-19 6 views
1

html 태그를 보존하는 텍스트를 검색하고 바꿀 수있는 Java 기반 html 파서를 찾고 있습니다. 이 질문은 이전에 여기에서 물어 보았습니다. 그러나 응답은 목표를 타격하지 않는 것처럼 보입니다. 내가 다운로드하고 그들이 일을 할 수 있는지를 알 수있는 간단한 프로그램을 작성한 HTML 파서는 거의 없다. 이들은 jsoup, Jericho, Java HTML 파서 등을 포함합니다. 검색을 수행 할 수 있지만 html 태그를 보존하는 텍스트를 대체 할 때는 검색을 수행 할 방법이 없습니다.html 태그를 보존하고 바꿉니다.

내가이 글의 전체 스레드를 읽고 : 오늘날 존재하는 그런 파서가없는

How to find/replace text in html while preserving html tags/structure

html search and replace on server side

경우, 하나를 구현하기위한 가장 좋은 방법은 무엇입니까? 이미 이와 같은 작업을 수행했다면 코드를 공유 할 수 있습니까?

+0

가 http://stackoverflow.com/questions/1856014/how-to-find- 보이는에있다 http://code.google.com/p/google-caja/source/browse/trunk/src/com/google/caja/parser/html/DomParser.java

에있다 html-tags-structure-html-tags-structure/replace-text-in-1856634 # 1856634 답장으로 무엇을 말 했습니까? 왜 "올바른"파서를 찾을 수없는 이유가 아닌가? – Osw

+0

나는 당신이 akaihola의 대답을 언급하기를 바랍니다. 3 단계에서 문제가 있습니다 - 문자열이 위치 1, 2 위치에서 발견 된 것으로 가정합니다. 3.에서 필요한 정규 표현식은 # (\ d +), 스택 \ s + # (\ d +), 오버플로 \ b 및 대체 # 1; 스택 % \ 2; 언더 플로우 – user576249

+0

몇 가지 해결책을 찾았습니까? 또는 어떻게 해결 했습니까? 공유하십시오. – Sourabh

답변

0

여리고 퍼서가 도움이 될 수 있습니다. 영원히 주변에 있었고 형식이 잘못된 HTML로 작동합니다. http://jericho.htmlparser.net/docs/index.html

+0

감사합니다.하지만 여리고는 시작 태그와 끝 태그 내에서만 교체 할 수 있습니다. 단순히 텍스트 검색을 수행하고 바꾸는 것으로 html 파서를 사용하지 않고도이 작업을 수행 할 수 있습니다. – user576249