data-munging

0열

1답변

많은 사람들이 겪었던 데이터 문제가 발생했습니다. 현재 거래 정보가 포함 된 데이터 세트가 있습니다. Transaction_Number에 따라 거래에 참여한 각 개인이 얼마나 오랫동안 지출했는지 확인할 수 있습니다. 나는 하나의 열을 잃었 것을이 Transaction_Number Created On Created_By Time_Diff

0열

1답변

어떤 판다는 여기에서 시작하십시오 이동이 필요 같은 순서

다른 프레임에서 행을 선택하기 위해 dataframes 열을 사용합니다. 모두 식별자 값을 가진 칼럼 id가 포함 A: id valA 8 ? 2 ? 4 ? B: id valB valC 1 ? ? 4 ? ? 3 ? ? 8 ? ? 2 ? ? I가

2열

1답변

파이썬 팬더 : 와이드 폼 DataFrame의 특정 변수 피벗

데이터 심오한 질문 : 어떻게 지나치게 넓은 DataFrame에서 특정 변수를 선택적으로 피벗시킬 수 있습니까? df1 = pd.DataFrame( [[1,'a','b',.1,-1,10], [2,'a','b',.2,-3,12], [3,'c','d',.3,-5,14]], columns=['sample','id1','id2',

1열

1답변

"모드. 삽입"의 sqlite 출력이 정확합니까?

CREATE TABLE tbl(x);과 함께 SQLite 데이터베이스에서 작성한 테이블을 고려해보십시오. 데이터는 INSERT INTO tbl VALUES(1); INSERT INTO tbl VALUES(2);입니다. 지금은 내가 PostgreSQL을에 가져 오려는이 스키마 및 데이터를 SQL 파일을 생성하고자하는 나는 다음을 수행하십시오 .mode ins

0열

1답변

정규식이 팬더 데이터 프레임과 작동하지 않습니다.

정규식을 사용하여 정리해야하는 이메일로 구성된 팬더 데이터 프레임이 있습니다. 그러나 컬럼을 지우려는 시도는 실제로 텍스트에 적용되지 않습니다. 예 데이터는 아래와 같다 : |subeject | description | --------------------------------------- |change email | 'Hi, I'm trying

1열

1답변

dplyr 축소 기간

아래 data.frame이 있으며 각 company_id에 대해 30 일 간격으로 기간을 "축소"하는 기간을 "청크"합니다. company_id startDate endDate 1 209952 2012-09-17 2012-10-17 2 209952 2012-10-17 2012-11-17 3 209952 2012-11-17 2012-12-17 4

2열

2답변

팬더 데이터 프레임을 서브 셋트하는 방법

팬텀 데이터 프레임에 50 개의 컬럼이 있고 30 개의 컬럼을 선택하고 싶습니다. df = ["a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l",............, "z"] 내가 어떻게 에 알려 주시기 바랍니다 "Z"까지 "H"에서 "A"와 "C"를 선택한 다음 모든 열을 선택하고 싶습니다 :

1열

1답변

중복으로 입력되지 않은 복제물을 R

에서 관리합니다. 주 기관의 데이터가 있는데이를 정리하려고합니다. 하나의 장애물은 제목에 대한 입력 표준이 없다는 것입니다 (예 : DIR, DIRECTOR, DIR., 모든 허용 가능한 입력). 또 다른 장애물은 개인이 여러 직책을 가질 수 있지만 그 중 단 하나만 입력된다는 것입니다. 예를 들어, 직원 # 1이 (Emp_1)보다 낮은 것으로 간주하십시오

0열

1답변

다른 테이블의 행 값을 형성하기 위해 테이블에서 data.table의 다른 열 값 결합하기

다음 표 DT-1을가집니다. 1 ABC XYZ 2 XYZ QRT 3 QRT RWQ 4 RWQ OIP 5 OIP KIJ 6 WET ERT 7 ERT YUP 8 YUP TIP 9 TIP IUR 10 IUR ETY 11 QRT ERT 12 RWQ YUP 13 XYZ QRT 14 QRT RWQ 15 YUP 행 2 표 1-5 형성된다 :

2열

2답변

단일 변수 데이터 프레임 분할

하나의 변수로 나타나는 CSV 파일이 있습니다. 나는 그것을 6으로 나누고 싶다. 나는 도움이 필요하다. str(nyt_data) 'data.frame': 3104 obs. of 1 variable: $ Article_ID.Date.Title.Subject.Topic.Code: Factor w/ 3104 levels "16833;7-Dec-03;Ruse