날짜 필드에 변형 기능을 사용하고 있으며 재구성 된 테이블에 필드가 나열되는 순서를 변경하는 방법이 있는지 궁금합니다. 재구성하기 전에 원본 테이블을 정렬하려고했지만 작동하지 않았습니다. # RuleID ErrorCount.2016-08-04 ErrorCount.2016-08-08
# 1 1 6 3
# 2 2 8
인자와 시간 간격이있는 표가 있습니다. 내가 원하는 것은 START_DATE과 END_DATE 사이의 간격으로 각 날짜가 긴 테이블을 만드는 것입니다. dt_in = pd.DataFrame({'factor':['A','B'],
'START_DATE':[pd.Timestamp('2015-01-01'),pd.Timestamp('2016-02-05'
에서 NumPy와 배열을 고치기 I ndarray의 형상을 다음과 같은 문제가있다 : 행에 out.shape = (20,)
reference.shape = (20,0)
norm = [out[i]/np.sum(out[i]) for i in range(len(out))]
# norm is a list now so I convert it to ndarray
열 1에 요소 변수가 있고 열 2에 연간 데이터가있는 와이드 형식의 데이터 프레임 목록이 있습니다. 이 데이터를 그래프로 나타내려고합니다. 그렇게하려면 긴 형식으로 다시 작성해야합니다. # SAMPLE DATA
x <- structure(list(State = structure(1:3, .Label = c("Alabama", "Alaska", "Arizo
아래와 같이 데이터 구조의 예를 만들었습니다. 문제 1 : "시작일"은 실제로 $ start와 $ end의 차이이지만 실제로 측정 일수는 반영되지 않았습니다. 그래서 $ id의 각 ID마다 카운터가 필요합니다. 따라서 id = 2는 "4"대신 "2"일 값을 가져야합니다. 솔루션 : Count <- rle(sort(activity$id))
activity$
큰 데이터 프레임을 재구성하는 방법을 연구했지만 몇 가지 어려움이 있습니다. srcipt를 실행했고 출력 데이터 프레임은 다음과 같습니다 (아래 참조) : 여기 예제 데이터베이스와의 링크와 스크립트가 있습니다. names(dataexample)
#To summary the categorical variables
str(dataexample)
# T
적합 한 gamlss 모델에서 데이터를 예측하려고하는데 귀찮은 문제가 있습니다. , 내가 다룰 수 없다. Error in data.frame(data, source = namelist) :
arguments imply differing number of rows: 3, 4
코드 & 데이터 library('gamlss')
asfr=c(0.000
나는 모든 것이 보이도록하는 데 익숙해있어서 Excel에서 Python으로 이동하는 데 어려움을 겪고 있습니다. 아래, 나는 위로 테이블을 아래 테이블로 변환하려고합니다. 팬더 데이터 프레임을 사용하고 싶었지만 다른 솔루션이 더 좋으면 듣고 싶습니다. 또한 추가 보너스로, 시각적으로 공감하는 일부 리소스로 파이썬으로 변환하는 사람을 가리킬 수 있다면 정말