2008-10-25 3 views
23

XEmacs에서 이것은 문자의 char-to-ucs 함수를 호출하여 수행됩니다. GNU Emacs는이 기능을 갖고 있지 않습니다. GNU Emacs에서 문자는 일반적인 정수처럼 보입니다. 라틴 문자에서 C-x =를 실행하면 Emacs 코드 포인트가 해당 문자의 유니 코드 코드 포인트와 다르다는 것을 알 수 있습니다. GNU Emacs에서 문자의 유니 코드 코드 포인트를 찾는 방법은 무엇입니까?GNU Emacs에서 문자의 유니 코드 코드 포인트 찾기

답변

40

최신 Emacs에서는 M-x describe-char가 문자를 가리킨다.
예 :

character: ¢ (2210, #o4242, #x8a2, U+00A2) 
    charset: latin-iso8859-1 
     (Right-Hand Part of Latin Alphabet 1 (ISO/IEC 8859-1): ISO-IR-100.) 
code point: #x22 
    syntax: w which means: word 
    category: l:Latin 
buffer code: #x81 #xA2 
    file code: #xC2 #xA2 (encoded by coding system utf-8) 
    display: by this font (glyph code) 
    -apple-monaco-medium-r-normal--12-120-72-72-m-120-mac-roman (#xA2) 

참고 문자의 유니 코드 코드 포인트를 제공하는 첫 번째 부분의 U + 00A2.

+11

설명 - 문자는 문자를 통해 C-X = 이맥스에서 23 장소 커서 (또한 "포인트") 결합 및 C-U C-X를, 이동 = – Leonel

4

빠른 답변 감사드립니다. 나는 describe-char의 소스 코드를 살펴 보았고 다음과 같은 문제점을 해결할 수있는 발췌문을 발견했습니다. 저는 XEmacs 21.4.13 Mule과 GNU Emacs 22.1.1에서 그것을 테스트했으며 작동하는 것으로 보입니다.

(or (get-char-property (point) 'untranslated-utf-8) 
    (encode-char (char-after) 'ucs))