2017-10-16 5 views
0

왜 이런 일이 발생하는지 알고 있습니까? 나는. 유니 코드 문자가 데이터 테이블 행 내에서 올바르게 표시되지 않는 이유는 무엇입니까? 그러나 벡터 (데이터 테이블 열)에 포함되면 올바르게 나타 납니까?R은 data.table에서 잘못된 인코딩을 보여 주지만 벡터에서는 맞음

>test.dt 

>fuel box   seller.name 
>1: Gasoline Manual Michels S<U+00E0>rl 

> test.dt[,seller.name] 
>[1] "Michels Sàrl" 

답변

0

동일한 예를 시도했는데 정상적으로 나타납니다.

+0

아니, 여전히 "미 헬스 S RL을"나를 위해. 그래서 내 R/랩탑 설정과 관련이 있습니까? – Iden

+0

5 월 .. R 32/64 비트 콘솔에서 같은 줄을 시도해 볼 수 있습니까? 스튜디오 콘솔에는 없습니다 –

+0

조금 다른 결과가 있습니다. R 3.4.2에서 64 비트 버전 "Michels S? rl". – Iden

1

보다 먼저 로케일이 올바르게 설정되어 있는지 확인을 검색 할 수 있습니다. 이것을 시도하십시오 :

그래도 작동하지 않으면 Windows에서 R의 알려진 버그로 실행 중일 수 있습니다. 이 버그의 다른 인스턴스에 대한 해결 방법에 대한 https://stackoverflow.com/a/46720368/6233565

를 참조하십시오이 시도 :

library(corpus) 
print.corpus_frame(df) 
+0

R - 3.4.1에서 좋다! –

+0

고마워, 패트릭, 이제는 코퍼스 라이브러리로 문자를 볼 수 있습니다. 데이터 테이블을 .csv 또는 .txt로 저장할 때 문자로 인해 내 문제가 해결되지는 않지만 ( – Iden

+0

관련 버그입니다. 현재 Windows에 UTF-8 데이터를 쓸 수 없습니다. https : // stackoverflow를 참조하십시오. .com/a/46734577/6233565 –