교체 파일에서 행을 읽고 적용 data <- data %>% mutate(city=replace(city, city=="Lower East, NY", "Manhattan, NY"))
data <- data %>% mutate(city=replace(city, city=="East Palo Alto, CA", "Palo Alto, CA"))
.. (mor
summarise_at 및 mutate_at을 동시에 여러 문자 변수에 사용하고 싶습니다. 정수 변수를 사용하는 많은 예제를 살펴 봤지만 문자 변수에 대해서는 이해할 수 없습니다. 바로 아래에 문자 (또는 요인) 변수에 대한 설명 통계를 생성하는 데 사용하는 코드가 있습니다. A tibble: 5 x 5
gender n totalN percen
내가 병합 할 tibbles 목록 (길이 = 5000)이 있습니다. 그들은 모두 동일한 열을 가지고 있으므로 dplyr::bind_rows을 사용하여 병합을 고려했습니다. 그것의 얼굴에 추가 된 tibble마다 행을 바인딩하는 것은 매우 빠릅니다. 그러나 더 많은 tibble이 추가됨에 따라 실행 시간은 선형 적으로 증가하는 대신 기하 급수적으로 증가합니다
나는 일하고있는 금액을 합산해야하는 데이터 세트를 가지고 있습니다. 나는 다른 변수의 한 요소로부터 금액을 합산하는 별도의 변수를 만들고 싶습니다 (예제는 미국 금액 임). 다음은이 코드를 개별적으로 수행해야하는 이유입니다.이 코드를 어떻게 결합 할 수 있습니까? library(dplyr)
new.data = old.data %>%
group_
여러 dplyr :: 조인 후 테이블에 여러 개의 중복 된 열이 있습니다. 테이블의 간단한 버전은 다음과 같습니다 col1 col2 col3 col4.x col4.y col5.x col5.y
난에 이름을 얻으려면 : col1 col2 col3 col4 col5
나는 select(tablename, -matches("*.y")) 이 결과로 * .Y 열
다음 스크립트를 작성하여 "뉴욕, 뉴욕"과 같은 도시의 주어진 입력 문자열에 해당하거나 가장 적합한 카운티를 찾습니다. 원하는 로직이 인라인으로 주석 처리됩니다. 최선을 다하고 코드를 재현성있게 만들었습니다. 해당 dat 및 place 입력 (2.2.1)을 변경하여 작동 방식을 확인할 수 있습니다. # Load Packages
library(acs)
l
나는 이름과 열 수의 차이 만 있으면서도 동일한 데이터 변환을 자주 수행합니다. 예를 들어, 내 실제 데이터에서 library(tidyverse)
test.data <- tribble(
~id.num, ~site, ~value1, ~value2, ~value3,
"10-01", "log", 1.5, 2.5, 3.5,
"10-02
데이터 프레임의 각 문자 colname에 대한 백분율을 계산하려고하지만 비율이 좋지 않습니다. 내 코드 : for(i in names(which((sapply(creditDF,class) == "character")))){
distribution <- creditDF %>%
group_by_at(.vars = i) %>%
summ
쉬운 작업이 있지만 그것을 설명하고 그것을 stackoverflow에서 찾기가 어렵습니다. 내가 얼마나 내가 그 결과, elementwise을 결합 할 수있는 세 가지 벡터 v1 <- c(1,1,1,1,1)
v2 <- c(2,2,2,2,2)
v3 <- c(3,3,3,3,3)
이 : 나는 rep(c(1,2,3), 5)하여이 벡터를 얻을 수 있다는 사실
내가 테이블이 '더블'입력 강요 할 수 없습니다 다음과 같습니다 numTable : 지금 나는이 칼럼의 각 outiers을 찾으려면을 . 아래에있는 내 코드를 참조하십시오 for (i in names(numTable)) {
#calculate mean and std for each column
meanValue <- mean(numTabl