많은 사람들이 겪었던 데이터 문제가 발생했습니다. 현재 거래 정보가 포함 된 데이터 세트가 있습니다. Transaction_Number에 따라 거래에 참여한 각 개인이 얼마나 오랫동안 지출했는지 확인할 수 있습니다. 나는 하나의 열을 잃었 것을이 Transaction_Number Created On Created_By Time_Diff
데이터 심오한 질문 : 어떻게 지나치게 넓은 DataFrame에서 특정 변수를 선택적으로 피벗시킬 수 있습니까? df1 = pd.DataFrame(
[[1,'a','b',.1,-1,10],
[2,'a','b',.2,-3,12],
[3,'c','d',.3,-5,14]],
columns=['sample','id1','id2',
CREATE TABLE tbl(x);과 함께 SQLite 데이터베이스에서 작성한 테이블을 고려해보십시오. 데이터는 INSERT INTO tbl VALUES(1); INSERT INTO tbl VALUES(2);입니다. 지금은 내가 PostgreSQL을에 가져 오려는이 스키마 및 데이터를 SQL 파일을 생성하고자하는 나는 다음을 수행하십시오 .mode ins
정규식을 사용하여 정리해야하는 이메일로 구성된 팬더 데이터 프레임이 있습니다. 그러나 컬럼을 지우려는 시도는 실제로 텍스트에 적용되지 않습니다. 예 데이터는 아래와 같다 : |subeject | description |
---------------------------------------
|change email | 'Hi, I'm trying
아래 data.frame이 있으며 각 company_id에 대해 30 일 간격으로 기간을 "축소"하는 기간을 "청크"합니다. company_id startDate endDate
1 209952 2012-09-17 2012-10-17
2 209952 2012-10-17 2012-11-17
3 209952 2012-11-17 2012-12-17
4
팬텀 데이터 프레임에 50 개의 컬럼이 있고 30 개의 컬럼을 선택하고 싶습니다. df = ["a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l",............, "z"]
내가 어떻게 에 알려 주시기 바랍니다 "Z"까지 "H"에서 "A"와 "C"를 선택한 다음 모든 열을 선택하고 싶습니다 :
에서 관리합니다. 주 기관의 데이터가 있는데이를 정리하려고합니다. 하나의 장애물은 제목에 대한 입력 표준이 없다는 것입니다 (예 : DIR, DIRECTOR, DIR., 모든 허용 가능한 입력). 또 다른 장애물은 개인이 여러 직책을 가질 수 있지만 그 중 단 하나만 입력된다는 것입니다. 예를 들어, 직원 # 1이 (Emp_1)보다 낮은 것으로 간주하십시오
하나의 변수로 나타나는 CSV 파일이 있습니다. 나는 그것을 6으로 나누고 싶다. 나는 도움이 필요하다. str(nyt_data)
'data.frame': 3104 obs. of 1 variable:
$ Article_ID.Date.Title.Subject.Topic.Code: Factor w/ 3104 levels "16833;7-Dec-03;Ruse