다음 데이터 프레임에서 모든 ID에 대해 마지막 두 개의 '시간'기간 동안 X의 롤링 합계가 필요합니다. df = pd.DataFrame({'ID':[1000, 1000, 1000, 2000, 2000, 2000, 3000,3000,3000],
'Time':[1,2,3,1,2,3,1,2,3],
'X':[101, 201, 123,
안녕 조건에 다른 dataframe를 사용하여 하나 dataframe에서 여러 컬럼의 값을 교체 ID x y
2 d NA
3 NA e
을하고이 같은 결과 후입니다 : DF1 : ID x y z
1 a b c
2 d b c
3 a e c
4 a b c
다른 게시물에서 제안한대로 매치 기능을 사용하려
가령 "Col_Strings"라는 열이있는 데이터 프레임이 있다고 가정 해 봅니다. 이 열은 30,000 개의 행을가집니다. 내 테이블에 처음 세 행만 표시합니다. 다음으로 데이터 프레임에 여러 개의 추가 열을 추가 할 것입니다. 나는 말한다 논리 사용하려는 : 내 열 이름이 "Col_Strings"의 행에 포함되어있는 경우 나 값이 1을 말하고 싶지을 .
올바른지 여부를 df 및 표시의 각 행의 유효성을 검사해야하는 유스 케이스가 있습니다. 유효성 검사 규칙은 다른 df에 있습니다. 다음 조건 rules 흘리는 상태는 임의의 행에 대해 일치하는지 Main
col1 col2
0 1 take me home
1 2 country roads
2 2 country roads take
3 4 me h
데이터 프레임 df_A에 'amin'과 'amax'라는 두 개의 열 (시간 범위 집합)이 있습니다. 나의 목표는 df_B의 열이 df_A 'amin'열과 'amax'열의 범위 열 사이에 있는지 여부를 찾는 것입니다. df_A[['amin','amax'] ]
amin amax
0 2016-07-16 19:37:03 201
처음으로 여기에 질문하는 것이므로 희망적으로 문제를 명확하게 설명하겠습니다. 나는 더 나은 시나리오 목록을 for 루프를 통해 동일한 데이터 세트에 적용하고 결과를 요약하는 방법을 이해하려고 노력하고있다. * 시나리오가 적용되고 데이터 프레임에서 관련 통계 데이터를 가져와 요약 테이블에 넣으면 정보를 보유 할 필요가 없습니다. Iterrows는 내가 원하는
특정 셀 내에서 숫자가 나타나는 특정 횟수를 계산해야합니다. DataFrame 스크린 값이 컬럼으로 Entity_Types 1~7 사이가 처음 나타나는 7,7,6,7,6,7,1,7,7,7,2을 가지고있다. 나는 추가 빈 열을 7 개 만들고 각 발생 빈도를 계산하여 Entity_Types_1, Entity_Types_2 ... 등으로 표시된 새 열에 추가해야
실험실에서 일부 데이터를 수집했으며 여러 엑셀 시트에 저장되어 있습니다. 엑셀 시트를 데이터 프레임에로드했는데 이제는 각 데이터 프레임에 대해 동일한 기능을 수행하려고합니다. 그러나 확실하지 않습니다. 사용자 기능 위의 마지막 줄에 하나의 데이터 프레임 인수를 허용하도록 수정 될 import glob
pattern = 'TRSCE*.csv'
1 개 또는 2 개의 열과 n 개의 행이있는 중첩 데이터 프레임의 열이있는 데이터 프레임이 있습니다. 'data.frame': 3 obs. of 2 variables:
$ vector:List of 3
..$ : chr "p1"
..$ : chr "p2"
..$ : chr "p3"
$ lists :List of 3
.
팬더와 함께 상당히 복잡한 groupby 작업을 수행하려고합니다. df1:
begin, end, y
0, 3, string10
3, 7, string11
df2:
begin, end, x
0, 2, string1
1, 2, string2
3, 4, string3
4, 6, string4
이 두 DF 어떤 특성을 가진 시간 슬롯을 나타