2017-11-19 7 views
1

여러분, 진지하게 저를 화나게하기 시작한 단순한 q입니다. 키릴 문자는 어떻게 사용합니까? 가져온 후에 xlsx 또는 csv 파일을 올바르게 읽고 R을 준비하려면 어떻게합니까? Google에서 다양한 형식으로 저장하고 인코딩을 사용하며 메모장에서 열어 Sys.setlocale ("LC_CTYPE", "ukrainian")을 넣는 등 다양한 옵션을 시도해 봤습니다.키릴 문자로 작업하기 R

나는

Sys.setlocale("LC_CTYPE", "ukrainian") 

# Set working directory 
setwd("C:~AO") 

# Packages 
library(xlsx) 

# Read file 
kyiv.dfrr <- read.xlsx2(file="Kyiv DFRR.xlsx", sheetIndex = 1, stringsAsFactors = FALSE) 

또는

kyiv.dfrr <- read.csv("Kyiv DFRR.csv", header = TRUE) 

결과 간단하고 우아한 해결책이 존재

      Type Planned Planned...9.months. Paid 
X..paid..planned..9.months. latitude 
1      ??????????? 62,821    27,344 21,875       
80.0 50.43494 
2      ??????????? 40,000    20,000 12,000       
60.0 50.45447 
3      ??????????? 50,000    50,000 14,539       
29.1 50.52310 
4      ???????????? 9,490     395  0       
0.0 50.48074 
5 ????????????????? (?????????????) 9,613    9,613 2,790       
29.0 50.52318 
6      ????????????? 9,821    2,000  0       
0.0 50.50171 
longitude Kyiv.city.district       MP 
1 30.54683   ?????????? ????? ?????? ????????????? 
2 30.50433  ?????????????? ???????? ???? ????????????? 
3 30.45902  ??????????? ????????? ?????? ??????????? 
4 30.40263  ?????????????? ???????? ???? ????????????? 
5 30.60095  ???????????  ?????? ???????? ???????? 
6 30.60764  ???????????  ?????? ???????? ???????? 

, 나는 여전히 희망이 사용! 감사!

+1

안녕하세요. UTF-8로 인코딩 된 키릴 문자의 Xlsx 파일 ('readxl' 또는'openxlsx' 라이브러리를 통해 읽음)과 CSV 파일은 문제없이 바로 사용할 수 있습니다. 가져온 데이터 (물음표 포함)를 CSV로 내보내고 Notepad ++ (모든 인코딩에서 효과가 있음)를 통해 열면 문제가 계속 발생합니까? 이것을 재현 할 수있는 데이터 파일을 제공 할 수 있습니까? –

+0

@AlexeyKnorre, 많은 의견에 감사드립니다. 데이터는 https://www.dropbox.com/s/ddx82m2xezx19m3/Kyiv%20DFRR.xlsx?dl=0 – Oleksiy

+0

@AlexeyKnorre에 있습니다. q도 업데이트합니다. 어떻게해야합니까? 나는 그것을 온라인으로 찾으려고 노력했다. 여러 가지 옵션을 시도했다. (나는 완전히 넘어 졌을 때 여기에와있다.) 어리석은 질문을하지 말라. 감사! – Oleksiy

답변

1

R (Studio) 로켈의 문제인 것 같습니다 (아래 재생 코드 참조). 1) XLSX 파일을 읽는 데 readxl을 사용하고, 2) 로케일을 사용하지 않아도됩니다. 이전에 CSV 파일을 읽는 것과 동일한 문제가 있었지만 encoding = "UTF-8" 로케일을 변경하는 대신에 RStudio 출력을 완전히 망 쳤습니다. - RStudio의 업데이트 만 도움이되었습니다.) 그래서 RStudio를 다시 시작하거나 다시 설치하려고합니다 (특히 동시에 업데이트 할 수있는 경우).

f <- "C:/Users/Alexey/Downloads/Kyiv DFRR.xlsx" 

df <- readxl::read_excel(f) 
Sys.setlocale("LC_CTYPE", "ukrainian") 

head(df) 
# A tibble: 6 x 10 
                                  Object 
                                   <chr> 
1                 "друга нитка Головного міського каналізаційного колектора \r\n" 
2 "об'єкт по вул. Воровського, 2, - реставрація з пристосуванням під розміщення Державного спеціалізованого мистецького навчального 
3 велика окружна дорога на ділянці від просп. Маршала Рокоссовського до вул. Богатирської з будівництвом транспортної розв'язки на 
4            "будівля бюджетної сфери - школа-дитячий садок N 173 \"Райдуга\" по вул. Блюхера, 3а" 
5           будівля бюджетної сфери - дошкільний навчальний заклад N 300 по вул. Радунській, 22/9а 
6               стадіон із штучним покриттям по вул. Драйзера, 2б, у Деснянському районі 
# ... with 9 more variables: Type <chr>, Planned <dbl>, `Planned (9 months)` <dbl>, Paid <dbl>, `% paid/ planned (9 
# months)` <dbl>, latitude <dbl>, longitude <dbl>, `Kyiv city district` <chr>, MP <chr> 
+0

글쎄, 난 RStudio를 업데이트하지만, 이미 엉망처럼 :) 0434> Oleksiy

+0

남자, 후 보인다 일부 조작 당신의 솔루션은 완벽하게 작동 :) Respectos :) – Oleksiy