상황은 다음과 같습니다. 많은 정수가 들어있는 문자 인 열 "a"가 있습니다. 각 정수는 범주를 나타냅니다. 각 관찰에 대해 그들이 포함하고있는 독특한 레벨을 알고 싶습니다. b 열은 원하는 결과를 나타냅니다. 중복으로 정리되었지만 각 고유 한 수준을 나타냅니다. 내가 알고 싶은 것은 칼럼 a를 어떻게 청소하여 칼럼 b처럼 보이는지입니다. 60k 행의 솔루
이 질문은 아주 기본적인 질문이지만 이해가 안됩니다. 참고로 간단한 스크립트를 사용하여 CSV 테이블을 읽고 필드 중 하나를 필터링하여 이것을 전달합니다. 새로운 변수에 추가하고 첫 번째 변수에 할당 된 메모리를 지 웁니다. 필자가 필터링 한 필드에서 unique()을 호출하면 결과가 실제로 필터링되었음을 알 수 있지만 원래 데이터 집합에있는 데이터에 해당
큰 데이터 프레임으로 작업하고 있습니다. 메모리에 조작을 쓰는 대신 파이프로 I을 수행하려고했습니다. 중간 단계에서 내 요인 수준을 확인하려고 시도 할 때 levels 기능을 사용하여 문제가 발생하여 문제가 무엇인지 알 수 있는지 궁금해졌습니다. 예 :이 library(dplyr)
Data <- data.frame(x = rep(LETTERS[1:5],3
다음에서이 메시지를 보냅니다. question 이렇게 피벗 한 후 데이터 프레임을 얻었습니다.
AVG GrossProfit AVG PMV Loss% Sales
ParentAuction Copart IAA Copart IAA Copart IAA Copart IAA
Make
Acura
데이터 세트를 테스트 및 교육 데이터 세트로 분리했습니다. 훈련 세트에 회귀 분석을 적용하려고 시도한 다음 테스트 세트에서 예측을 사용합니다. 이 작업을 수행하면 "model.frame 요소 x에 오류가 있습니다. 새 수준이 있습니다"라는 오류 메시지가 나타납니다. 내 훈련 데이터에는 나타나지 않는 테스트 데이터에 레벨이 있기 때문입니다. 내가 원하는 것은
큰 열차 집합에서 임의의 포리스트를해야하지만 더 많은 53 가지 수준의 변수를 사용할 수는 없습니다. 요인 변수 (train$tip) 줄이기 위해 150 레벨 (KHC, KTF, KGL, ...)이 필요합니다. 몇 번 나타나고 더 많은 수의 레벨을 가진 레벨을 (빠르게) 제거 (또는 53 레벨 만 유지) 할 수 있습니까? 몇 가지 수준이 있거나 더 빠른 방
내 고객은 전자 상거래 사이트가 Drupal로 만들어져 있습니다. 프론트 엔드 (제품 "재고 있음", "재고 없음")에 표시된 재고 수준 전용으로 이전 개발자가 drupal을 프로그래밍하여 외부 API에서이 정보를 얻습니다. 글쎄, 지금은 드루팔 (Drupal의 내부 재고 관리에서 재고 수준을 얻으려면이 기능을 되돌려 야하지만, 그 방법을 알 수 없다. 나
data.frame에 두 개의 열이 있습니다.이 열은 동일한 순서로 정렬 된 레벨을 가져야하지만 간단하게하는 방법을 모르겠습니다. library(ggplot2)
library(dplyr)
library(magrittr)
set.seed(1)
df1 <- data.frame(rating = sample(c("GOOD","BAD","AVERAGE"),1
R에 내 PA.csv를 읽었습니다. 여기에 문제가 있습니다. 왜 내 달 수준이 이렇게 주문됩니까? levels(PA$Month)
[1] "1" "10" "11" "12" "2" "3" "4" "5" "6" "7" "8" "9"
내가 ggplot2에 의해 음모를 그릴이 데이터를 사용하고, x 축이 PA$Month 경우, 그래픽 표시 할 수 있지만, 각