의 행 그룹화 및 합계. 한 줄 안에 값을 그룹화하고 합산하는 효율적인 방법을 찾고 있습니다. 내 데이터 행은 다음과 같이 분배됩니다. 10000 10 20000 20 40000 12 60000 23 10000 12 40000 17. 결과가 필요합니다. 10000 22 20000 20 40000 29 60000 23. 큰 숫자는 특성이 작고 발생합니다. 내
41040 obs의 대형 데이터 프레임이 있습니다. 20 변수. 모의 데이터 세트를 간소화하여 질문을 이해하기 쉽습니다. 내가 무엇을 가지고 : 내가이에서 원하는 무엇 rm(list = ls())
variable <- rep(c('var1', 'var1_2', 'var1_3', 'var1_4'), 5)
group <- as.factor(rep(c('c
이것은 데이터베이스에서 추출한 예제입니다. 공동 저자의 시각화 작업을하고 있으므로이 샘플을 기반으로 두 명의 작가에게 한 가지 관계 만 유지해야합니다. Brian Norton --- Maria Roo Ons 또는 Maria Roo Ons --- Brian Norton 중 하나를 삭제해야 관계를 유지할 수 있습니다. -----------------------
라이브러리 (readr) 및 read_csv() 함수에 대한 R에서 가장 좋아하는 점은 거의 항상 데이터의 열 유형을 올바른 클래스로 설정한다는 것입니다. 그러나 현재 데이터가 명확하게 숫자 인 경우에도 모든 문자 클래스의 데이터 프레임으로 데이터를 반환하는 R의 API를 사용하고 있습니다. 일부 스포츠 데이터가 예를 들어이 dataframe을 보자 : d
데이터 프레임에 날짜 열이 있습니다. 각 날짜는 일반적으로 두 번 반복됩니다. 여기에 다른 컬럼에서 일부 스포츠 팀의 이름을 가지고 내 dataframe의 예입니다 dput(mydf)
structure(list(date_game = structure(c(15643, 15643, 15643, 15644,
15644, 15644, 15646, 15646),
나는 다음과 같은 유형의 dataframe df이 : 지금 내 원래의 끝으로이 값을 연결하고자하는 Result A B C
ID
1 1 0 0
2 1 1 0
3 0 0 1
: ID Result Other_val
1 A y
2 B x
2 A x
3 C abc
pd.crosstab(df.ID, df.Result) 사용 후를,이
나는 현재 다음과 같습니다 데이터 집합이 있습니다 Time Var1 Var2
2013 Q4 123 756
2013 Q4 657 987
2014 Q1 746 756
2014 Q1 66 999
2014 Q2 774 542
을 그리고 숫자 변수, 뭔가에이 범주 '시간'변수를 변환 할 필요가있는 Time Var1 Var2 n.Time
2013 Q4
데이터 프레임에 열을 포함하려고합니다. 하나의 변수를 참조해야하기 때문에 추가하려면 MAP 도구를 사용하고 있습니다. 나는 column D 참조로 X을 복용하고 싶으 X Y Z
xx high 10
slow 20
fat 30
xy high 15
slow 10
fast 30