Windows 7 64 비트에서 R 2.15.0을 사용하고 있습니다. 유니 코드 (CJK) 텍스트를 파일로 출력하고 싶습니다.UTF-8 파일 출력 : R
다음 코드는 유니 코드 문자가 작동하지 않는 UTF-8 파일 연결을 작성하는 전송 방법을 보여줍니다 예상 (I) :
Read 1 item
[1] "<U+5728>"
:
rty <- file("test.txt",encoding="UTF-8")
write("在", file=rty)
close(rty)
rty <- file("test.txt",encoding="UTF-8")
scan(rty,what=character())
close(rty)
스캔의 출력에 의해 같이
파일은 UTF 문자 자체로 작성된 것이 아니라 일부 종류의 ANSI 호환 대체 파일로 작성되었습니다. 처음으로 제대로 작동하도록 할 수 있습니까 (예 : 대신 "있음"이 포함 된 텍스트 파일 사용). 또는 코드 문자열을 대체하는 적절한 문자로 출력을 유니 코드로 변환하는 데 추가 마법을 사용할 수 있습니까?
감사합니다.
[자세한 정보 : Cygwin, R 2.14.2에서 은 올바르게으로 동작하고, Win7에서는 2.14.2도 깨졌습니다. 어딘가에 내 끝인가요?]
[최신 업데이트] 문제는 인코딩보다는 * 로캘 *에있는 경향이 있습니다. 일시적으로 로케일을 "적절한"것으로 변경함으로써 횡설수설 한 출력 문제를 해결했습니다. 하나 이상의 로케일에있는 언어 데이터가있는 경우 하나님이 도와드립니다. – Patrick
어쩌면이 [게시물] (http://stackoverflow.com/questions/11069908/r-extracting-clean-utf-8-text-from-a-web-page-scraped-with-rcurl?lq=1) 도움. – DJJ