dplyr

0열

1답변

dplyr는 : 스크립트가 데이터 프레임에서 문자열을 대체 할 dplyr 라인을 다음과 실행 기능을

교체 파일에서 행을 읽고 적용 data <- data %>% mutate(city=replace(city, city=="Lower East, NY", "Manhattan, NY")) data <- data %>% mutate(city=replace(city, city=="East Palo Alto, CA", "Palo Alto, CA")) .. (mor

2열

1답변

"summarise_at"및 "mutate_if"문자 변수에 대한 설명 통계

summarise_at 및 mutate_at을 동시에 여러 문자 변수에 사용하고 싶습니다. 정수 변수를 사용하는 많은 예제를 살펴 봤지만 문자 변수에 대해서는 이해할 수 없습니다. 바로 아래에 문자 (또는 요인) 변수에 대한 설명 통계를 생성하는 데 사용하는 코드가 있습니다. A tibble: 5 x 5 gender n totalN percen

3열

2답변

dplyr bind_rows 실행 시간 지수가

내가 병합 할 tibbles 목록 (길이 = 5000)이 있습니다. 그들은 모두 동일한 열을 가지고 있으므로 dplyr::bind_rows을 사용하여 병합을 고려했습니다. 그것의 얼굴에 추가 된 tibble마다 행을 바인딩하는 것은 매우 빠릅니다. 그러나 더 많은 tibble이 추가됨에 따라 실행 시간은 선형 적으로 증가하는 대신 기하 급수적으로 증가합니다

1열

1답변

합계를 요인으로 변경하는 방법은 무엇입니까?

나는 일하고있는 금액을 합산해야하는 데이터 세트를 가지고 있습니다. 나는 다른 변수의 한 요소로부터 금액을 합산하는 별도의 변수를 만들고 싶습니다 (예제는 미국 금액 임). 다음은이 코드를 개별적으로 수행해야하는 이유입니다.이 코드를 어떻게 결합 할 수 있습니까? library(dplyr) new.data = old.data %>% group_

1열

1답변

R 정규식이있는 열 이름 바꾸기

여러 dplyr :: 조인 후 테이블에 여러 개의 중복 된 열이 있습니다. 테이블의 간단한 버전은 다음과 같습니다 col1 col2 col3 col4.x col4.y col5.x col5.y 난에 이름을 얻으려면 : col1 col2 col3 col4 col5 나는 select(tablename, -matches("*.y")) 이 결과로 * .Y 열

0열

1답변

로직 기능 : 카운티 선택을위한 지오 코딩 스크립트

다음 스크립트를 작성하여 "뉴욕, 뉴욕"과 같은 도시의 주어진 입력 문자열에 해당하거나 가장 적합한 카운티를 찾습니다. 원하는 로직이 인라인으로 주석 처리됩니다. 최선을 다하고 코드를 재현성있게 만들었습니다. 해당 dat 및 place 입력 (2.2.1)을 변경하여 작동 방식을 확인할 수 있습니다. # Load Packages library(acs) l

2열

1답변

...을 사용하여 함수를 작성하고 ... dplyr :: recode의 명명 된 대체 항목으로 확장 R

나는 이름과 열 수의 차이 만 있으면서도 동일한 데이터 변환을 자주 수행합니다. 예를 들어, 내 실제 데이터에서 library(tidyverse) test.data <- tribble( ~id.num, ~site, ~value1, ~value2, ~value3, "10-01", "log", 1.5, 2.5, 3.5, "10-02

1열

1답변

dplyr에 의해 그룹과 백분율을 계산하십시오.

데이터 프레임의 각 문자 colname에 대한 백분율을 계산하려고하지만 비율이 좋지 않습니다. 내 코드 : for(i in names(which((sapply(creditDF,class) == "character")))){ distribution <- creditDF %>% group_by_at(.vars = i) %>% summ

1열

2답변

요소를 벡터로 결합합니다.

쉬운 작업이 있지만 그것을 설명하고 그것을 stackoverflow에서 찾기가 어렵습니다. 내가 얼마나 내가 그 결과, elementwise을 결합 할 수있는 세 가지 벡터 v1 <- c(1,1,1,1,1) v2 <- c(2,2,2,2,2) v3 <- c(3,3,3,3,3) 이 : 나는 rep(c(1,2,3), 5)하여이 벡터를 얻을 수 있다는 사실

2열

1답변

이 오류 메시지를 해석하는 방법 : (목록) 개체가

내가 테이블이 '더블'입력 강요 할 수 없습니다 다음과 같습니다 numTable : 지금 나는이 칼럼의 각 outiers을 찾으려면을 . 아래에있는 내 코드를 참조하십시오 for (i in names(numTable)) { #calculate mean and std for each column meanValue <- mean(numTabl