Wikipedia article on UTF-8을 읽고, 나는 이라는 단어에 대해 궁금해했습니다.. 이 용어는 여러 번 사용되지만 그 의미에 대한 정의 나 참조를 제공하지 않습니다.정확히 무엇이 과도한 형태/인코딩입니까?
누군가가 용어와 목적을 설명 할 수 있는지 알고 싶습니다.
Wikipedia article on UTF-8을 읽고, 나는 이라는 단어에 대해 궁금해했습니다.. 이 용어는 여러 번 사용되지만 그 의미에 대한 정의 나 참조를 제공하지 않습니다.정확히 무엇이 과도한 형태/인코딩입니까?
누군가가 용어와 목적을 설명 할 수 있는지 알고 싶습니다.
코드 포인트의 인코딩은 필요한 것보다 많은 코드 단위를 필요로합니다.
예를 들어 U + 0020은 UTF-8로 단일 바이트 0x20
으로 표시됩니다. 0xc0 0xa0
두 바이트를 정상적으로 디코드하면 U + 0020으로 다시 돌아 가게되지만 잘못된 표현입니다.
Unicode Corrigendum #1에는 특히 표 3.1B에 대한 추가 정보가 있습니다.
UTF-8은 이론적으로 더 짧은 문자를 다른 표현으로 허용합니다. 예를 들어 MSB를 0으로 설정하여 ASCII 문자를 2 바이트로 인코딩 할 수 있습니다. UTF-8 명세는이를 명시 적으로 금지하고있다.
끔찍한 말. 아래로 투표했다. – Computer
@Computer : o.O 어떤 말장난을 놓쳤습니까? – Joey
당신은 말했습니다! – Computer