cvs2svn 도구를 사용하여 CVN 데이터베이스를 SVN으로 변환했지만 모든 유니 코드 텍스트 파일이 UFT-8로 변경되었으므로 필자는이를 원하지 않습니다.유니 코드 텍스트 파일을 cvs2svn으로 UTF-8로 변환하지 않으려면 어떻게해야합니까?
어떻게 피할 수 있습니까? 유니 코드 파일을 보관할 플래그 또는 매개 변수가 있습니까?
cvs2svn 도구를 사용하여 CVN 데이터베이스를 SVN으로 변환했지만 모든 유니 코드 텍스트 파일이 UFT-8로 변경되었으므로 필자는이를 원하지 않습니다.유니 코드 텍스트 파일을 cvs2svn으로 UTF-8로 변환하지 않으려면 어떻게해야합니까?
어떻게 피할 수 있습니까? 유니 코드 파일을 보관할 플래그 또는 매개 변수가 있습니까?
실수로 유니 코드라고하는 것은 UTF-16LE라고 가정합니다. 이 cvs2svn의 옵션이며,이 문서에있다 : 파일 이름의 인코딩과 같은
--encoding=ENC
사용 ENC는 CVS의 REPOS에 메시지 및 저자 이름을 기록합니다. (--options 파일을 사용하면 파일 이름에 사용할 인코딩 한 세트를 지정하고 로그 메시지 및 작성자 이름에 대해 두 번째 세트를 지정할 수 있습니다.)이 옵션은 여러 번 지정할 수 있습니다.이 경우 여러 번 인코딩 할 수 있습니다 하나가 성공할 때까지 명령. 기본값 : ascii. 다른 가능한 값은 표준 파이썬 인코딩을 포함합니다.
따라서 --encoding=utf_16_le
을 명령 줄에 전달할 수 있습니다.
인코딩 윈도우는 "유니 코드"가 UTF-16LE 인 것으로 오해 할 수 있습니다. 이것은 ASCII 호환이 아니기 때문에 번거로운 인코딩입니다. Windows는 당시 (UTF-8이 발명되기 전에) 유니 코드 텍스트의 가장 일반적인 인코딩이 될 것으로 예상 되었기 때문에이를 채택했습니다. 오늘날 UTF-8은 파일 내 유니 코드 저장을 위해 선호되는 인코딩입니다.
dda의 대답은 아마도 작동해야합니다 (+1). Subversion은 UTF-16 파일을 텍스트로 처리하는 것을 지원하지 않습니다.이 파일은 바이너리 파일로 처리되므로 diff/patch/merge를 사용할 수 없습니다. 이런 이유로 나는 cvs2svn에게 UTF-8로 파일을 보내도록 강력히 권한다.
유니 코드가 인코딩이 아니며 UTF-8이 유니 코드의 일부임을 알고 있습니까? – dda