하나의 인도 언어 (벵갈 어)에서 특정 단어 앞에 모든 단어를 가져 오려고합니다. 이 기술은 영어 완벽하게 작동하지만 벵골어 실패 : Regex 구문 분석에서 유니 코드를 처리하십시오.
Pattern p = Pattern.compile("([\\w\\s]+) ছবি", Pattern.UNICODE_CASE);
Matcher m = p.matcher("ক্যামেরাকে ছবি তোলা এবং ভিডিও রেকর্ড এর অনুমতি দেবেন");
while (m.find()) {
System.err.println(m.group(1));
}
그래서 이상적으로, 나는 텍스트
ছবি তোলা এবং ভিডিও রেকর্ড...
이전 인 출력으로 단어
ক্যামেরাকে
를 얻기 위해 노력하고 있어요. 덧붙여 말하자면 이것은이 예에서 첫 번째 단어이지만, 사실이 아닐 수도 있습니다.
어떻게하면됩니까? 나는 안드로이드에서 이것을하려고 노력하고있다.
편집
자바 솔루션을 시도 여기지도 :
감사합니다! 벵골 문자에 대한
어떤 오류가 있습니까? –
@AmirHKH 출력을 전혀 얻지 못했습니다! –
'\ p {InBeng}','Pattern.compile ("([\\ p {InBeng} \\ s] +) 시도해보십시오.")' –