자주 묻는 질문은 "should"를 사용하고 동일한 요구 사항을 일관성없이 사용하는 것부터 시작됩니다. 유니 코드 표준 자체 (FAQ에 인용)가 더 정확합니다. 기본적으로 프로그램이 정규적으로 동등한 문자열을 다르게 취급한다고 기대해서는 안되지만 모든 프로그램이 동일한 것으로 간주해야한다고 생각해서는 안됩니다.
실제로는 소프트웨어가 수행해야하는 작업에 따라 다릅니다. 대부분의 상황에서는 전혀 정규화 할 필요가 없으며 정규화는 데이터의 필수 정보를 파괴 할 수 있습니다.
예를 들어, U + 0387 GREEK ANO TELEIA (·)는 U + 00B7 MIDDLE DOT (·)과 동일한 정식으로 정의됩니다. 문자는 정말 뚜렷하고 다르게 렌더링되어야하고 처리시 다르게 취급되어야하기 때문에 이것은 실수였습니다. 그러나 유니 코드의이 부분이 돌로 새겨 져 있기 때문에 그것을 변경하기에는 너무 늦었습니다. 따라서 데이터를 NFC로 변환하거나 정규적으로 동일한 문자열 사이의 차이를 무시하면 잘못된 문자가 표시 될 위험이 있습니다.
님이 걸릴 위험이 있으므로은 정규화하지 않습니다.예를 들어, 문자 "ä"는 단일 유니 코드 문자 U + 00E4 라틴 소문자 A로 표시되거나 두 유니 코드 문자 U + 0061 라틴 소문자 A U + 0308 결합 단점으로 나타날 수 있습니다. 대부분 전자, 즉 사전 작성된 양식이지만 후자이고 "ä"가 포함 된 데이터에 대한 코드 테스트의 경우 미리 작성된 양식 만 사용하면 후자를 감지하지 못합니다. 그러나 많은 경우에 그러한 일을하지 않고 단순히 데이터를 저장하고, 문자열을 연결하고, 인쇄하는 등의 작업을 수행합니다. 그러면 두 표현이 다소 다른 렌더링을 초래할 위험이 있습니다.
소프트웨어가 문자 데이터를 어떻게 든 다른 소프트웨어로 전달하는지 여부도 중요합니다. 수신자는 순전 한 가정이나 의식적으로 그리고 문서화 된 방식으로 입력이 정상화 될 것으로 기대할 수 있습니다.
«레거시 인코딩에서 변환 된 문자열과 더 호환되기 때문에 NFC는 일반 텍스트에 가장 적합한 형식입니다. ... NFD와 NFKD는 내부 처리에 가장 유용합니다.»다소 가짜 진술입니다. 레거시 문자열은 유니 코드로 변환 할 때 NFC 형식으로 제공 될 수 있지만 향후 유지 관리를 위해 (예기치 않은 조건에서 코드가 사용되는 경우) NF [CD]로 명시 적으로 변환하는 것이 좋습니다. – ninjalj