2014-07-15 4 views
1

문자열 토큰 화기를 사용하고 API를 변환하여 간지 문자를 히라가나로 변환합니다. 쿼리의 코드 (What is the replacement for Language Analysis framework's Morpheme analysis deprecated APIs)는 대부분의 한자를 히라가나로 변환하지만이 API는 3-4 자로 된 한자 단어를 변환하지 못합니다. 같은 -일본어 문자열을 토큰 화하고 히라가나로 변환

a) 現 人 神 라틴어로 변환한다 - '겐 REN 쉔'과의 hiragana- 'げ ん じ ん し ん' 가 있어야하는 반면 - 라틴 - 'Arahitogami'과의 hiragana- 'あ ら ひ と が み'

b) 安 本 丹 라틴어로 변환한다 - '는 벤 댄 및 hiragana-'や す も と ま こ と " 이되어야하는 반면에 -에 라틴 - '야스 모토의 순정'과의 hiragana- 'あ ん ぽ ん た ん"

주된 목적은 주어진 일본어 텍스트에 대한 루비 텍스트를 얻는 것입니다. 나는 lang 분석 프레임 워크를 64 비트에서 사용할 수 없기 때문에 사용할 수 없다.

제안 사항? 이러한 문자열 변환을 수행하는 다른 API가 있습니까?

답변

0

두 경우 모두 API는 onyomi를 사용하지만 그렇게해서는 안됩니다. 그래서 나는 "3 개 또는 그 이상의 문자를 추측한다고 가정합니다. 대부분의 경우에는 onyomi가 더 적절해야합니다. 그래서 그것을 사용합니다." 문제의 실제 사전과 같은 소리가 필요합니다 (download).

이름 (b))은 여전히 ​​문제가됩니다. 네이티브 japanese 사람들도 때로는 실패로 컴퓨터가 kanjis에서 올바른 이름을 얻을 수 있어야 어떻게 볼 수 없습니다. jisho.org安本丹이라는 단일 이름조차 찾지 못합니다.

은 (Btw는 당신이 b)에 히라가나를 혼합하고,의 라틴어 'あ ん ぽ ん た ん'. 그래서 나는이 여기 떠날거야 내 담당자와 아직 의견을 쓸 수 없습니다)

+0

에서 제공하는 링크는 온라인이다 나는 코코아 애플리케이션에서 그렇게하고 싶다. Kakasi 라이브러리를 사용하는 것이 나을 것 같아요. 64 비트에서이를 수행하는 OSX 지원 API가 있는지 알고 싶었습니다. 이는 32 비트에서 lang 분석 프레임 워크로 사용할 수 있기 때문입니다. – Nitesh

+0

제공된 링크는 데이터베이스 파일을 다운로드하기 위해 다른 사이트에 대한 링크를 제공하는 온라인 사전입니다. 아무도 귀하의 질문에 대답하지 않고 다른 "APIs"를 요청했고 데이터베이스를 사용하여 직접 할 수 있습니다. 다른 기존 API를 찾지 못하신 경우 ... – Slyps

+0

이 페이지는 Kakashi를 설치할 수 있다고 말합니다. OS X Mavericks로 변환합니다. http://qiita.com/mountcedar/items/f140837393a1697a8433. 이 기사는 또한 Kakashi가 입력 문자열로 euc-jp만을 받아들이 기 때문에 문자 세트를 UTF-8에서 euc-jp로 변환하기 위해 네트워크 칸지 필터 인'nkf'가 필요하다고 언급합니다. – naota