2016-09-02 6 views
0

오라클 11g에서 UTL_FILE을 사용하여 파일을 가져 오려고합니다. 파일의 charater 인코딩이 무엇인지 알 수있는 방법이 있습니까?파일 문자 집합 - 오라클

내가하려고하는 것은 삽입시 오류를 피하기 위해 파일의 charset이 UTF-8과 다른 경우 오류를 반환하는 것입니다.

답변

0

아마 (적어도 쉽게).

정말로 운이 좋다면 파일은 으로 시작하여 파일이 적절한 수준의 신뢰도로 UTF-8로 인코딩되었는지 확인할 수 있습니다. 하지만 이는 파일의 전적으로 선택적인 속성이며 파일에서 실제 데이터를 읽기 전에 코드에서 버려야 할 속성입니다.

그 이상으로 데이터를 검사하고 가장 가능성있는 문자 집합을 결정하려고합니다. 일반적으로 파일의 첫 번째 수백 또는 수천 바이트가 유효한 7 비트 ASCII 및 UTF-8 일 수있는 대부분 영어 파일 인 경우 특히 어렵습니다. 파일을 읽고 잘못된 UTF-8 코드 포인트가 있는지 살펴볼 수 있습니다. UTF-8이 맞다는 것을 확실하게 말할 수는 없지만, 마치 실제로있는 것처럼 행동 할만큼 충분히 근접해 있습니다.