2010-04-16 3 views
0

웹 페이지에서 얻은 텍스트에서 텍스트 조작을 수행해야하는이 프로젝트를 진행하고 있습니다. 이제이 작업을 수행하는 첫 번째 단계는 중복 된 정보를 무시하고 필요한 본문 텍스트를 추출하는 파서를 찾는 것입니다. 내가 프로그래밍을 처음 접하는 이래로 어떻게해야할지 모르겠다. 내가 얻을 수있는 도움에 정말 감사 할 것입니다. 소스 포지에서 사용할 수 지금 막 HTMLParser를 사용하여 그 일을하고HTML Parser가 텍스트를 추출합니다 (java)

+8

http://stackoverflow.com/search?q=java+html+parser 중 하나를 선택하십시오. –

답변