제 코드로 두 개의 엑셀 데이터베이스를 결합 할 수 있습니다. 문제는 단지 수입 만 표시하고 열 노출은 표시하지 않는다는 것입니다. 좀 더 명확히하기 위해 코드와 예제를 남겨 두었습니다. 나는 시도했다 : df1 = df1.pivot(index = "Cliente", columns='Fecha', values=['Impresiones','Revenue'])
customer gender customer_ids
1 0 [1,2,3]
2 1 [6,2,1]
3 0 [4,3,9]
위와 같이 CSV 파일에 일부 데이터가 있습니다. 나는이이 "['1','2','3']", ... 같은 문자열로 CUSTOMER_IDS로드이 df = pd.read_csv('customer.csv'
두 개의 다른 데이터 프레임을 추가, dataframe, dataframe의 B 및 dataframe C 말한다. Dataframe이 같은 파이썬 코드 내에서 정의된다 (a.iloc의 [: 0] = 0은 즉 연산을 가능하게하기 위해 제공되어, 교체 "NaN이" "제로") Dataframe B를Dataframe 및 C 형 이렇게 엑셀 시트로부터 호출된다 b=
[ "Ticker", "Adj.Factor", "Date"] 열이있는 데이터 프레임 df1과 df2가 있습니다. df1의 해당 행에있는 "Adj.Factor"의 값이 0이면 df1의 전체 행을 df2에 추가하려고합니다. 다음 코드가 있습니다. for x in range(tot_len):
if df1.iloc[x]['Adj.Factor'] == 0:
if x in y 문을 실행할 때 ValueError를 던지는 팬더에서 실행중인 작은 함수가 있습니다. 부울 인덱싱, .isin() 및 where()을 추천하는 비슷한 소리가 나는 문제를 봤지만 어떤 경우 든 내 사례에 적용 할 수 없었습니다. 어떤 조언을 주시면 감사하겠습니다. 추가 참고 : groups은 데이터 프레임 외부의 문자열을 포함하는 목록입니다
두 개의 다른 유형의 열이 field 열에 쌓여있는 테이블이 있습니다 (속성 및 질문). question_1 및 question_2가 쌓인 상태를 유지하면서 그 성과 나이가 열이 될 수 있도록 +-------+------------+-------+
| id | field | value |
+-------+------------+-------+
| 52
내가 가진 : df = pd.DataFrame({'A':[1, 2, -3],'B':[1,2,6]})
df
A B
0 1 1
1 2 2
2 -3 6
Q를 : 어떻게받을 수 있나요 : A
0 1
1 2
2 1.5
이 groupby() 및 aggregate()를 사용하고 계십니까? 뭔가 같은 df.groupby([0,1], axis=
일반적으로 사용되는 팬더 DataFrame 열 명명 규칙이 있습니까? 여기서 PEP8 (예 : 인스턴스 변수)을 권장합니까? 헤더가있는 외부 소스에서 많은 양의 데이터가로드된다는 사실을 염두에 두지 만 필자가 직접 열 이름을 변경하거나 이름을 바꿔야 할 때 올바른 접근 방식은 무엇인지 궁금합니다.
PYTHON에 pandas 데이터 프레임이 있습니다. 이 데이터 프레임을 하이브 테이블로 만들고로드하고 싶습니다. pandas 데이터 프레임에서 spark 데이터 프레임을 만들고 하이브 테이블을 만들 수 있다는 것을 알고 있습니다. pyspark을 사용하지 않는 순수한 python 방법을 사용하고 싶습니다. NotImplementedError: Wrong