ARC2을 사용하면 텍스트 데이터가 손상됩니다.ARC2 (PHP 시맨틱 웹 라이브러리)가 UTF-8 파일을 UTF-8로 잘못 변환합니다.
내 RDF 입력 파일이 UTF-8 형식입니다. LOAD <path/to/file.rdf>
쿼리를 통해 MySQL 백엔드를 사용하는 ARC2에로드됩니다. MySQL 데이터베이스는 UTF-8로되어 있습니다. PHPMyAdmin을 사용하여 확인하면됩니다.
그러나 텍스트 데이터가 손상됩니다. 몇 가지 변환 확인 후 문제는 원래 UTF-8 파일이 ISO-8859-1로 간주되어 UTF-8로 다시 변환 된 것으로 보입니다.
예 : "surmonté"→ "surmonteÌ".
"surmonteiet"는 데이터베이스에서 UTF-8로 능동적으로 사용할 수 있습니다.
이것은 ARC2가 파일을 열 때 (철저하게 깊지는 않지만 상당히 깊지는 않지만 의심스런 것을 보여주지 않았 음) 또는 PHP와 MySQL에서 좀 더 일반적인 경우 일 수 있습니까?
가져온 데이터를 잘못 인코딩하지 않고 원본으로 가져 오도록하려면 어떻게해야합니까?
ARC2는 파일이나 데이터베이스 연결에 대한 인코딩을 언제든지 지정합니까? 그렇지 않은 경우 문제가 발생한 부분 인 latin1로 기본 설정됩니다. – deceze
@deceze 네, 물론 이것은 제가 처음 체크 한 것입니다. 그리고 명시 적으로 [UTF-8로 데이터베이스와 데이터 정렬을 만듭니다] (https://github.com/semsol/arc2/blob/master/store/ARC2_Store. php # L59). 다음 데이터베이스에 연결할 때 명시 적으로 상태를 나타내지 않지만 그 의미가 있을지 모르겠다 ...? – MattiSG
데이터베이스와 데이터 정렬은 연결 인코딩 없이는 의미가 없습니다. http://kunststube.net/frontback을 참조하십시오. – deceze