호환 정규 형식의 문자열이 해당 표준 정규 형식으로 이미 있습니까?

내 테스트에서는 유니 코드 6.2부터 완전한 호환성 분해의 모든 문자에 NFD_Quick_Check = Yes 속성이 있음을 알 수 있습니다.호환 정규 형식의 문자열이 해당 표준 정규 형식으로 이미 있습니까?

이것은 NFKD (x)가 isNFD (x)를 의미하고 NFKC (x)가 isNFC (x)를 의미한다고 생각하게합니다.

내 결론이 정확합니까? 안정성은 어떨까요? 이러한 의미가 향후 유니 코드 표준 버전에서 유지 될 수 있습니까?

2013-03-28 R. Martinho Fernandes

귀하의 결론은 정확합니다. 유니 코드 표준 부록 # 15 주 제 Design Goals : 정규화 된 문자열이 할당되지 않은 코드 포인트를 포함하지 않는 경우 안정성과 관련하여

toNFKC(x) = toNFC(toNFKC(x)) 
toNFKD(x) = toNFD(toNFKD(x))

, 이것은 유니 코드의 향후 버전에 대한 진정한 개최한다.

출처

2013-09-29 22:42:06 nwellnhof

6 개월 후! 정말 고마워. 누군가가 나에게 이것을 어떻게 그리워했는지 설명 할 수 있을까요? ;) –

I가 발견 here 다음 상태 : 환언

은 NFC 및 NFKC의 조성물의 위상이 동일한 오닐 그들의 분해 위상 NFKC 호환성 분해를 적용하여, 다르다됩니다.

는 다음 또한이이 :

복합 문자로 변환 정상화의 두 가지 형태가 있습니다

: 정규화 형식 C 및 정규화 양식 KC는. 이들의 차이점은 결과 텍스트가 원래의 비정규 화 된 텍스트와 일치하는지 또는 원래의 비정규 화 된 텍스트와 동일한 호환성인지 여부에 따라 다릅니다. (NFKC와 NFKD에서 K는 컴포지션을 나타내는 C와의 혼동을 피하기 위해 호환성을 나타 내기 위해 사용됩니다.) 두 유형의 정규화는 서로 다른 환경에서 유용 할 수 있습니다. 처음 세 도면에서

는 NFKD 형태 항상 NFD 형태와 동일하므로, 간략화를 위해 그 열은 생략하도록 NFKC 형태는 항상 NFC 형태 동일하다.

이것은 내가 당신의 질문의 적어도 일부를 밝힐 수있는 텍스트를 골라 낼 수있는 것입니다.

NFD 정규화 양식 정식 분해 : 문자가 정규 동등성에 의해 분해되고, 다수의 결합 문자는 특정 순서로 배치되어있다가 거기 Wikipedia article이 표는 또한

도움이되기를 바랍니다.

NFC 정규화 양식 표준 구성 : 문자가 분해 된 다음 표준 등가로 재구성됩니다.

NFKD 정규화 양식 호환성 분해 : 문자 호환성에 의해 분해되며, 여러 조합 문자는 특정한 순서로 배열된다.

NFKC 정규화 형식 호환성 구성 : 문자는 호환성에 따라 분해 된 다음 표준 등가로 재구성됩니다.

이러한 것들의 설명을 보면, 나는 당신이 다른 하나를 암시한다고 결론 지을 수 있다고 생각하지 않습니다.NFD는 표준 호환성으로 분해되지만 NFKD는 호환성으로 분해됩니다.

같은 기사가도 상태 :

동등한 기준 중 하나 일 수 정식 (NF) 또는 적합성 (NFK).

나에게 이것은 표준 또는 그 호환성을 의미합니다. NFD와 NFKD는 다른 일을합니다.

이 implementation notes 기사에서는이 상태 : 모든 버전

, 심지어 이전에 유니 코드 4.1로, 다음과 같은 정책이 다음에 :

정규화 된 문자열 안정을 보장; 즉, 일단 정규화되면 문자열은 이후 버전의 모든 유니 코드에 따라 표준화됩니다.

출처

2013-03-29 00:20:41

호환 정규 형식의 문자열이 해당 표준 정규 형식으로 이미 있습니까?

답변

관련 문제