전통 간체 [핀 1 yin1]/영어 해당하는 1/동등 나는 그것을 구문 분석을 시도했습니다 2/
구분 기호 (자바)를 사용합니다.
String delims = "[\\[\\]/]+";
String tokens[] = str.split(delims);
문제는 영어 동등한도 구분 토큰이 포함되어 있습니다 :
이것은 내가 지금까지있는 것입니다. 예를 들어
:
⿔ ⿔ 龜의 [gui1]/변형 | 龟 [gui1]/
어떻게 사람이 문자열을 구문 분석?
간체 :
전통 ⿔
: ⿔병음 : gui1
영어 나 문자열에서 다음과 같은 정보를 얻으려고
동등한 : 변형의 龜 | 龟 [ gui1]
좀 더 정교한하시기 바랍니다, 문자열이 아무 의미가없는 CEDICT 여러 정의가 종종 있기 때문에, 조금 더 복잡 마에. –
문자열에 'a/b/c /'라고 쓰고 b에 구분 기호 '/'가 포함될 수 있습니다. a와 c도 구분 기호를 포함 할 수 있습니까? – brianestey
CEDICT입니까? 뭔가를 놓칠 수도 있습니다. 형식은 "Traditional Simplified [pin1 yin1]/English equivalent 1/equivalent 2 /.../ equivalent n /" – wuliang