2017-03-21 2 views
-1

그래서 나는 다른 언어로 단어를 검색하는 프로젝트에 참여하고 있습니다. 나는 언어의 Locale을 쉽게 얻을 수 있지만 다른 언어로 단어를 검색하는 방법을 모른다. 따라서 텍스트는 중국어로 표시 될 수 있으며 검색 할 단어는 영어로 표시 될 수 있습니다. 예를 들어 PHP에서 우리는 grapheme_stripos 자바에서 비슷한 기능을 찾고 있습니다. 나는 자바에서 서체 검색을하는 것을 발견하지 못했습니다. 그래서 한 가지 방법은 문자열을 분해하여 바이트 배열에 저장하고 검색하지만 목적을 해결하는 PHP의 grapheme_stripos와 같은 것이 더 좋지 않을까요?자바에서 검색하기

+0

"책, 도구, 소프트웨어 라이브러리, 자습서 또는 기타 오프 사이트 리소스를 추천하거나 찾도록 요청하는 질문은 유인책의 답변과 스팸을 끌어 당기는 경향이 있으므로 스택 오버플로에 대해 주제를 벗어났습니다. 지금까지 그것을 해결하기 위해 완료되었습니다. " – pvg

+0

나는 대안을 언급했지만 더 나은 해결책을 찾고있다. 이것은 기본적으로 이론적 인 질문이므로 개념/아이디어를 묻는 것은 잘못되었다고 생각한다. 그리고 당신이 자세히 보면 도서관/튜토리얼/도구를 요구하지도 않으며 코드를 묻지도 않습니다. 난 그냥 올바른 방향으로 요점을 찾고 :) 감사합니다 – Rohan

+0

그것은 기본적으로 당신이 당신 자신을 할 수있는 당신을 위해 구글로 사람들을 요구하고 있습니다. 표준 도구가 제공하는 것을 보았습니까? 어느 것을 시도 했습니까 (https://mvnrepository.com/artifact/com.ibm.icu/icu4j?) 그리고 누락 된 부분 등 – pvg

답변

0

PHP는 UTF-8을 사용하기 때문에, 자습서를 찾는 것이 쉽지 않습니다. Java는 UCS-2를 사용합니다. 대부분의 문자 (모든 BMP 변환기)는 Character입니다. 일부 CJK는 BMP를 벗어났습니다.

java.lang.String의 CodePoints 관련 기능을 확인하십시오. 대부분의 경우 indexOfregionMatches이 옳은 일을합니다.

또한 전체 텍스트 검색 전용 솔루션을 살펴보십시오.