tidyverse

2열

2답변

시간별, 그룹별로 시계열 데이터를 채울 방법을 찾고있었습니다. 내가 사용하고있는 매우 비효율적 인 방식은 그룹당 데이터 집합을 split으로 설정하고 해당 목록의 모든 요소에서 사용자 정의 시계열 채우기 기능 (최대와 최소 사이의 시퀀스 생성 및 병합)을 적용하는 것입니다. 말할 필요도없이,이 작업은 분할을 통과하지 않을 것입니다. 내 데이터 세트의 모습

0열

1답변

unnest_tokens의 반대편

이것은 어리석은 질문 일 가능성이 높습니다.하지만 저는 인터넷 검색을 시도하고 해결책을 찾지 못했습니다. 내 질문에 대해 검색 할 수있는 올바른 방법을 모르기 때문입니다. 나는 정지 문자를 없애기 위해 R으로 깔끔한 텍스트 형식으로 변환 한 데이터 프레임을 가지고 있습니다. 이제 데이터 프레임을 원래 형식으로 되돌릴 수 있습니다. unnest_tokens의

1열

1답변

데이터 프레임의 값을 사용하여 read_csv에서 열 유형을 지정하십시오.

여러 csv 파일의 디렉토리를 읽으려고합니다. 각 파일은 약 7K + 행과 ~ 1800 열입니다. 데이터 딕셔너리의 각 행에서 변수 (열) 이름과 데이터 유형을 식별하는 데이터 프레임을 읽을 수있는 데이터 딕셔너리가 있습니다. readr 패키지 내에있는 ?read_csv을 보면, 열 유형을 지정할 수 있습니다. 그러나 필자는 거의 1800 개의 열을 지정

1열

1답변

는 어떻게 그룹화 및 요약 dataframe 후 결혼과 경쟁하여 데이터를 분할으로 작성한 forcats 패키지에서 gss_cat 데이터 세트를 사용 ReadXL 및 Tidyverse

library(dplyr) library(tidyr) library(forcats) library(readxl) 를 사용하여 다른 엑셀 탭에 테이블의 목록에서 각각 그룹화 표를 내보내려면 변수 (여기에 lapply를 사용하는 것보다 더 좋은 정리 방법이있는 경우 큰 보너스가됩니다). Survey<-gss_cat%>% select(marital,

0열

2답변

반환 값은

내 데이터 세트가 훨씬 더 큰 물론이지만 원리는 동일 R : library(tidyverse) df <- tibble(Name1 = c("Joe", "Harry", "Jane", NA, NA), Name2 = c("Joe", "Harry", "Thomas", "Bill", "Jane")) 질문 1 : 어떻게에서 값을 추출 할 수 있습니다 (

1열

1답변

R : dplyr

을 사용하여 여러 열 (비슷한 이름으로)의 하위 집합을 조정합니다. 최근에 R의 공통 데이터 프레임 조작에서 tidyverse로 이동했습니다. 하지만 scale() 함수를 사용하여 열의 크기를 조절하는 것과 관련하여 문제가 발생했습니다. 내 데이터는 일부가 숫자이고 일부 카테고리 기능이있는 열로 구성됩니다. 또한 마지막 열은 데이터의 y 값입니다. 그래서

1열

2답변

조건부로 열의 값을 다른 열의 값으로 바꾸기 dplyr

정말 답을 찾기 위해 열심히 노력했고 중복 된 경우 사과합니다. 나는 내 질문을 설명하기 위해 더미 데이터를 만들 것이다. tibble(a=c(0.1, 0.2, 0.3), sample1 = c(0, 1, 1), sample2 = c(1, 1, 0)) # A tibble: 3 x 3 a sample1 sample2 <dbl> <dbl> <db

-2열

2답변

데이터를 그룹화하여 데이터 프레임을 줄이는 방법은 무엇입니까?

:) 특정 데이터 세트를 특정 특성의 축소 된 데이터 프레임으로 그룹화하는 쉬운 방법이 있습니까? 이 알고리즘을 생각하고 있었지만 R에이 함수를 사용할 수있는 함수가 있습니까? 예 ... 나는 dplyr를 사용하려고했지만, 그것은 매우 잘 작동 didin't : PS를 :. 내 데이터가 1 GB 이상의 매트릭스에, 즉 더 자동화 된 프로세스가 필요합니다

-1열

2답변

purrr :: map으로 만든 목록 항목의 이름 얻기

나는 purrr :: map을 사용하여 csv 파일 목록을 검색하고 큰 목록을 얻었습니다. csv_files <- list.files(path = data_path, pattern = '\\.csv$', full.names = TRUE) all_csv <- purrr::map(csv_files, readr::read_csv2) names(

1열

2답변

깔끔한 평가 의미로 여러 열을 선택, 복제 및 이름을 바꾸는 방법은 무엇입니까?

아래쪽 평가에서 variable_unmodified 및 variable 값을 가질 수 있도록 내 tibble에서 변수 집합을 복사하고 싶습니다. 구식 밑줄 인 NSE select_() 함수와 .dots을 사용하여 해킹 된 버전을 만들었지 만, 더 새로운 NSE 방식의 깔끔한 평가 방식을 사용하고자합니다. 이것은 내가 원하는 것을 : tibble_to_max