1
사용자가 주석을 제출하고 해당 값의 유니 코드 코드 포인트 배열을 가져오고, 유효하지 않은 코드 포인트를 선택하고이를 버리고 주석을 저장하려고합니다. 어떻게하면됩니까?유니 코드 코드 포인트는 어떻게 처리합니까?
사용자는 "안녕하세요"제출, 나는 다음과 같은 값으로 배열 $codepoints
을 가져올 :
$codepoints[0] = 0068
$codepoints[1] = 0065
$codepoints[2] = 006C
$codepoints[3] = 006C
$codepoints[4] = 006F
을 그리고, 어떤 이상한 이유로, 나는 문자 "L"을 허용하지 않으려는 , 그래서 나는 코드 포인트 U + 006C로 문자를 버리고 싶다. 따라서 저장된 주석은 "heo"가됩니다. 이것도 가능합니까?
미리 감사드립니다.
참조 http://stackoverflow.com/questions/395832/how-to-get-code-point-number-for-a-given-character-in-a-utf-8-string –
mb_convert_encoding을 사용하는 것이 더 좋습니다. 멀티 바이트가 설치되어있는 경우 코드 포인트는 UTF-8 또는 UTF-16LE/BE를 디코딩 한 후 얻는 것입니다. 코드 포인트는 일반적으로 24 비트 정수로 나타내지 만 대부분의 시스템 속도는 32 비트 정수를 사용하여 코드 포인트를 나타냅니다. 문자는 글리프의 표시에 따라 하나 이상의 코드 포인트가 될 수 있습니다. – Rahly