나는 팬더 PRICE Name PER CATEGORY STORENAME
0 9.99 MF gram Indica Store1
1 9.99 HY gram Herb Store2
2 9.99 FF gram Herb Store2
에 DataFrame이 내가 다음 범주에 그 분할에 고유 한 이름을 가지고 여러 데이터 프레임으로이 분할되고
R 생존 패키지 용으로 구성된 데이터가 있지만 다른 구조를 사용하는 Graphpad Prism에서 작동하도록 데이터를 내보내려고합니다. I 필요한 출력은 시간 후 종류 이상의 열 각 처리를 정리하고,이 Treatment Time Status
A 3 1
A 4 1
A 5 0
A 5 0
A 5 0
B 1 1
B
나는 두 개의 판다 데이터 프레임 인 a와 b를 가지고 있습니다. a와 b는 영어 문자열이 들어있는 두 개의 공통 열 (예 : x와 y)을 공유합니다. x와 y의 각 조합은 a와 b 내에서 uniq입니다. 내가 계산할 수 x와 y의 공통 부분 집합이 있습니다 c = pandas.merge(a, b, on=['x', 'y'])
는 내가에 관심이하면 나머지
a = dd.read_csv('huge.csv', blocksize=1e6)
g = a.groupby(['col_a', 'col_b'])
g.col_c.sum().max().compute() # failed, MemoryError
저는 dask.dataframe이 메모리 문제에서 실패하지 않을 것이라고 생각했지만 무엇입니까? 은 BTW, 나는 매우
포인트가 충분하지 않은 행의 그룹 라벨 값을 변경해야합니다. I는 C2 내의 값과 각 그룹 내의 포인트의 최소 개수에 그룹 인 경우, 예를 들어 , +-----+
|c1|c2|
+-----+
|A |1 |
|A |2 |
|B |1 |
|A |2 |
|E |5 |
|E |6 |
|W |1 |
+-----+
는 명확 c2:
1 : cou
이전 개체를 기반으로 새 개체를 만드는 함수를 작성하려고했습니다 (몇 가지 변경 후). 그러나, 나는 그것을 할 수 없었습니다. 여기 내 데이터 프레임의 여기 Names <- c("Tom", "Alex", "James", "John", "Wayne", "Harry")
a <- c(1,3,6,8, NA, 5)
b <- c(3,6,9,1, NA,1)
c
저는 20 개의 더하기 열이있는 데이터 프레임을 가지고 있는데,이 각각의 열에 대해 다음과 같은 glm 모델을 만들고 싶습니다. 동일한 테스트 세트로 평가하십시오. # Train-test splitting
smp_size <- floor(0.70 * nrow(x))
index <- sample(seq_len(nrow(x)),size = smp_size)
나는 n = '239', s = 'male', m = 'is1'에 대해 df1을 호출하여 여러 데이터 프레임 (n, s, m으로 구분) : Days 24hU 24hF ...
1 1e-3 .... ...
2 8e-4 .... ...
5 6e-4 .... ...
... .... .... ...
모든 dataframes은이 같
간단한 문제로 약간 어려움을 겪고 있습니다. 희망을위한 간단한 해결책도 있습니다. 내 데이터 프레임은 다음과 같습니다. DataFrame:
8 buy 4
7 sell 1
6 buy 1
5 sell 3
4 sell 10
3 buy 100
2 buy 110
1 buy 120
서로 다른 주문을 추가하는 방법이 있습니까? 그래서 df 변환 : D
여기 신기한 질문은,이 함수가 이전에 생성 된 df를 반환하지 않는 이유를 이해할 수 없습니다. df는 길이가 821 행이고, print len(output_df.index)>10000은 False이다. 문이 경우 다음 if len(output_df.index)>10000:
print("Table is too large to display, dow