2014-10-19 3 views
1

twitter4j를 사용하여 짹짹에서 언급 한 해시 태그, 사용자 이름 및 URL을 쉽게 제거 할 수 있습니까? getHashtagEntities(), getUserMentionEntities() 및 getURLEntities()를 사용하면 해당 엔티티와 문자열에서 해당 위치를 검색 할 수 있지만 어떻게 짹짹을 "정리"할 수 있습니까?Twitter4j를 사용하여 짹짹에서 해시 태그, 사용자 이름 및 URL 제거

나는 replaceAll (entity, "") 메소드를 사용하여 트윗의 모든 엔티티를 ""로 대체하려고 생각했지만 항상 올바른 결과를 제공하지는 않습니다. (예 : _ht # #ht "라고 말하면 안된다).

답변

1

나는 각 엔티티에 대해 replaceAll() 메서드를 사용하여 lookbehind "(?<!\w)"을 사용하여 끝내고 이것이 내 문제를 해결했다고 생각합니다. 그러나 나는 정규식과 replaceAll() 메서드가 매우 느릴 수 있다고 들었다. 그래서 누군가 다른 제안을한다면 나는 그것들을 읽은 것을 기쁘게 생각한다.

+0

이 removeAll을 구현하는 클래스는 무엇입니까? – perrohunter

+0

죄송합니다. replaceAll()을 작성하려고합니다. 나는 String 객체로 작업하고 있었다. – GeorgeG