ICU의 규칙 프레임 워크는 불규칙한 발음을 가진 소스 언어에서는 잘 작동하지 않습니다. 슬프게도 영어는 특히 발음하기 어렵습니다.
음역이란 대상 언어로 된 원어의 발음을 에뮬레이션하는 것을 의미합니다. 이것은 두 부분으로 구성된다. (a) 입력을 발음을 나타내는 중간 표현으로 변환한다. (b) 발음을 최종 출력으로 변환하는 것.
영어 - 우르두어에서 규칙 기반 ICU 프레임 워크는 결코 (a)에 대해 좋은 결과를 제공하지 않지만 (b)를 수행하는 좋은 시스템이 될 가능성이 높습니다. TTS (text-to-speech) 시스템을 통해 영어 문자열을 실행하거나 적어도 매우 큰 발음 사전에서 입력을 찾는 것이 좋습니다. 이것은 International Phonetic Alphabet에서 발음을 줄 것입니다. 일단 발음을하면 ICU는 Urdu를 생성하기에 합리적으로 잘 작동해야합니다.
이제 ICU에는 국제 음운 알파벳을 우르두어로 변환하는 규칙이 없습니다. 유니 코드의 음역 규칙을 관리하는 사람으로서 이것은 구현하기가 매우 쉽다고 생각합니다. 나는 약간의 시간을 찾았을 때 기꺼이 그것을 할 것입니다. (그러나 누구나 패치를 보내실 수 있습니다!)이 길로 가고 싶다면 http://unicode.org/cldr/trac/newticket에 버그를 보내주십시오.
urdu에서 roman urdu 로의 변환에 관한 것을 찾았습니까? –