2011-10-20 5 views
7

C#에서는 4 바이트 문자가 어떻게 표현됩니까? 한 문자 또는 두 문자 세트처럼?C에서 표현되는 4 바이트 문자는 어떻습니까

var someCharacter = 'x'; //put 4 bytes UTF-16 character 
+0

'4 바이트 문자'의 예를 들어 주시겠습니까? 그것은 당신의 질문을 명확하게 만들 것입니다. – jv42

+0

@ jv42에는 2 바이트로 표시 할 수없는 일부 UTF-16 문자가 있습니다. 그래서 그것은 2 중 임의의 문자입니다^16 – SiberianGuy

+2

Jon Skeet의 "Unicode and .NET"기사 참조 - http://csharpindepth.com/Articles/General/Unicode.aspx – sll

답변

11

C#을 수있는 char 유형의 Basic Multilingual Plane 만 저장 문자. 이 비행기 외부의 문자의 경우 surrogates이라는 두 개의 char을 사용해야합니다.

string s = "\U0001D11E"; 

UTF-16를 참조하십시오 : 문자와 같은

또한 문자열을 사용할 수 있습니다.