JVM에서 제공하는 문자 세트의 다른 바이트 길이를 알고 싶습니다. 예를 들어, ASCII, non-acsii char set, 중국어 문자 등이 있습니다.java에서 다른 문자 세트의 바이트 길이는 얼마입니까?
어떤 생각 덕분에 :)
JVM에서 제공하는 문자 세트의 다른 바이트 길이를 알고 싶습니다. 예를 들어, ASCII, non-acsii char set, 중국어 문자 등이 있습니다.java에서 다른 문자 세트의 바이트 길이는 얼마입니까?
어떤 생각 덕분에 :)
전화 Charset.availableCharsets().values();
는 목록을 반복하고있는 ByteArrayOutputStream에 몇 가지 미리 정의 된 문자열을 인쇄 할 수 있습니다. 그런 다음 바이트를 가져오고 배열 길이를 봅니다.
ASCII, CP * 및 ISO 8859- *는 1 바이트입니다. UCS-2는 2 바이트입니다. UTF-16은 2 또는 4 바이트입니다. UTF-32 및 UCS-4는 4 바이트입니다. 대부분의 다른 것들 (UTF-8, GB2312, EUC-JP, ShiftJIS 등)은 가변적입니다.
"2 또는 4 바이트"(UTF-16의 경우)에도 변수가 들립니다. ;-) –