dataframe

    2

    1답변

    나는 팬더 PRICE Name PER CATEGORY STORENAME 0 9.99 MF gram Indica Store1 1 9.99 HY gram Herb Store2 2 9.99 FF gram Herb Store2 에 DataFrame이 내가 다음 범주에 그 분할에 고유 한 이름을 가지고 여러 데이터 프레임으로이 분할되고

    1

    1답변

    R 생존 패키지 용으로 구성된 데이터가 있지만 다른 구조를 사용하는 Graphpad Prism에서 작동하도록 데이터를 내보내려고합니다. I 필요한 출력은 시간 후 종류 이상의 열 각 처리를 정리하고,이 Treatment Time Status A 3 1 A 4 1 A 5 0 A 5 0 A 5 0 B 1 1 B

    1

    1답변

    나는 두 개의 판다 데이터 프레임 인 a와 b를 가지고 있습니다. a와 b는 영어 문자열이 들어있는 두 개의 공통 열 (예 : x와 y)을 공유합니다. x와 y의 각 조합은 a와 b 내에서 uniq입니다. 내가 계산할 수 x와 y의 공통 부분 집합이 있습니다 c = pandas.merge(a, b, on=['x', 'y']) 는 내가에 관심이하면 나머지

    0

    1답변

    a = dd.read_csv('huge.csv', blocksize=1e6) g = a.groupby(['col_a', 'col_b']) g.col_c.sum().max().compute() # failed, MemoryError 저는 dask.dataframe이 메모리 문제에서 실패하지 않을 것이라고 생각했지만 무엇입니까? 은 BTW, 나는 매우

    1

    1답변

    포인트가 충분하지 않은 행의 그룹 라벨 값을 변경해야합니다. I는 C2 내의 값과 각 그룹 내의 포인트의 최소 개수에 그룹 인 경우, 예를 들어 , +-----+ |c1|c2| +-----+ |A |1 | |A |2 | |B |1 | |A |2 | |E |5 | |E |6 | |W |1 | +-----+ 는 명확 c2: 1 : cou

    1

    1답변

    이전 개체를 기반으로 새 개체를 만드는 함수를 작성하려고했습니다 (몇 가지 변경 후). 그러나, 나는 그것을 할 수 없었습니다. 여기 내 데이터 프레임의 여기 Names <- c("Tom", "Alex", "James", "John", "Wayne", "Harry") a <- c(1,3,6,8, NA, 5) b <- c(3,6,9,1, NA,1) c

    0

    1답변

    저는 20 개의 더하기 열이있는 데이터 프레임을 가지고 있는데,이 각각의 열에 대해 다음과 같은 glm 모델을 만들고 싶습니다. 동일한 테스트 세트로 평가하십시오. # Train-test splitting smp_size <- floor(0.70 * nrow(x)) index <- sample(seq_len(nrow(x)),size = smp_size)

    0

    1답변

    나는 n = '239', s = 'male', m = 'is1'에 대해 df1을 호출하여 여러 데이터 프레임 (n, s, m으로 구분) : Days 24hU 24hF ... 1 1e-3 .... ... 2 8e-4 .... ... 5 6e-4 .... ... ... .... .... ... 모든 dataframes은이 같

    1

    2답변

    간단한 문제로 약간 어려움을 겪고 있습니다. 희망을위한 간단한 해결책도 있습니다. 내 데이터 프레임은 다음과 같습니다. DataFrame: 8 buy 4 7 sell 1 6 buy 1 5 sell 3 4 sell 10 3 buy 100 2 buy 110 1 buy 120 서로 다른 주문을 추가하는 방법이 있습니까? 그래서 df 변환 : D

    0

    1답변

    여기 신기한 질문은,이 함수가 이전에 생성 된 df를 반환하지 않는 이유를 이해할 수 없습니다. df는 길이가 821 행이고, print len(output_df.index)>10000은 False이다. 문이 경우 다음 if len(output_df.index)>10000: print("Table is too large to display, dow