jsoncpp에서 json 문자열의 문자 코딩 유형 인 UTF-8, ANSI 또는 UNICODE를 얻으려고합니까? json :: value의 문자 코딩 타입을 얻는 방법? 감사합니다.json 파일의 문자 코딩 유형을 얻는 방법은 무엇입니까?
0
A
답변
0
모든 문자열은 일부 기본 규칙 (null 종결 자, json의 금지 기호 등)을 준수하는 바이트 시퀀스입니다. 인코딩은 문자열 이진 데이터를 나타내는 방법 일 뿐이므로 문자열을 형성하는 데 사용 된 인코딩을 결정하는 마법 같은 방법은 없습니다. 따라서 json 문자열 인코딩은 json 발급자 (설명서에 있음)에서 지정해야합니다. 또는 정보가 json의 일부 여야합니다 (어떤 이유로 다른 문자열이 다른 인코딩을 사용하는 경우).
0
문자열의 문자 인코딩을 결정하는 것은 상당히 복잡합니다. 적합한 애플리케이션을 선택하려면 this SO answer을 참조하십시오.
Apache Tika - the content analysis toolkit는 다음의 인용문에 따르면, 어쩌면 가장 진보 중 하나입니다
아파치 티카 ™ 툴킷 감지 및 PPT, XLS 등 천 개 이상의 다른 파일 형식 (메타 데이터 및 텍스트를 추출, 및 PDF). 이러한 모든 파일 형식은 단일 인터페이스를 통해 파싱 될 수 있으므로 Tika는 검색 엔진 색인 작성, 콘텐츠 분석, 번역 등에 유용합니다. 다운로드 페이지에서 최신 릴리스를 찾을 수 있습니다.
이러한 라이브러리 각각으로 JSON 문자열을 분석하면 추가 처리에 사용할 수있는 (가능한) CharSet이 생성 될 수 있습니다.