텍스트 파일이 30GB입니다. 파일의 인코딩은 UTF8이지만 일부 Windows-1252 문자도 포함됩니다. 따라서 가져 오기를 시도하면 다음 오류가 발생합니다. ERROR: invalid byte sequence for encoding "UTF8": 0x9b
어떻게 해결할 수 있습니까? 파일에 이미 UTF8 형식이 있습니다.이 파일에 대해 'file'
setlocale(LC_ALL, "Hebrew")으로 새 로케일을 설정 한 후 새로운 로컬 이름 (Hebrew.Israel.1255)을 인쇄 할 수 있었지만 printf(%c, 240)이 '?'로 인쇄되었으므로 새 로켈의 charset을 사용하는 방법을 파악할 수 없었습니다. 히브리어 문자 (1255 map) 대신. . 미리 감사드립니다.
내가 혼합 히브리어를 표시 HTML 페이지를 썼다가/영어 content.It이 캐릭터 세트와 함께 잘 작동 "윈도우 - 1255" <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN""http://www.w3.org/TR/html4/loose.dtd">
<html dir="rtl" lang="he