C#의 문자열 및 문자에 대한 질문이 하나 있습니다. C#의 문자열이 유니 코드 문자열이고 char가 2 바이트를 차지하는 것으로 나타났습니다. 따라서 모든 문자는 UTF-16 인코딩입니다. 멋지 네요. 그러나 Wikipedia에서도 UTF-16에서 4 바이트를 가져 오는 문자가 있다는 것을 읽었습니다.문자열과 4 바이트 유니 코드 문자
문자 숫자 식 표시를 위해 문자를 그릴 수있는 프로그램을 만들고 있습니다. 프로그램에는 테스터가있어 문자열을 쓸 수 있으며, 어떻게 보이는지 볼 수 있습니다.
그래서 사용자가 4 바이트, 즉 2자를 차지하는 문자를 쓰는 문자열로 어떻게해야합니까? 문자열을 통해 char을 통해 char을 가져와야하기 때문에 목록에서이 char을 찾아서 패널에 그려야합니다.
charinging char는 단순히 작동하지 않습니다. 문자, 합자, 제어 문자 등이 결합되어 있으므로 코드 포인트로 코드 포인트를 지정해도 작동하지 않습니다. – CodesInChaos
올바른 표시 표현 단위를 'grapheme 클러스터'라고합니다. 때로는 둘 이상의 코드 포인트가 있습니다. –