누락 된 데이터를 나타내는 CSV로 만든 데이터 프레임이 있습니까? 상징. 얼마나 많은 행이 있는지 확인하고 싶습니다. 발생 횟수와 함께 발생합니다. 지금까지 내가 이걸 만들었지 만 모든 행의 수를 보여줄뿐 아니라 그 수를 보여 줬어? 발생합니다. print(sum([True for idx,row in df.iterrows() if
any(row.str.
저는 카테고리 값의 가치에 근거하여 4 번째 값 (버디의 2 가지 유형 중 하나)을 할당하려고합니다.는 무작위로 할당 된 3 개 기능에 대한 값을 작은 DF : Unique_ID Category Age Sex Buddy
0 0 2 11 male NaN
1 1 3 7 female NaN
2 2 1 4 male
아파치 서버 로그 데이터를 사전 처리하고 있습니다. ID, TIME 및 BYTES라는 3 개의 열이 있습니다. 예 : ID 및 NBSP & NBSP TIME & NBSP & NBSP BYTES 1 NBSP & NBSP 13시 & NBSP & NBSP 10 2 NBSP & NBSP 13시 2분 & NBSP & NBSP 30 3 NBSP & NBSP 13시 3
중간 절대 오류를 최소화하여 1 차원 선형 회귀를 수행하고자합니다. 처음에는 상당히 표준적인 사용 사례라고 가정했지만 빠른 검색을 통해 놀랍게도 모든 회귀 및 보간 함수는 평균 제곱 오류를 사용함이 드러났습니다. 내 질문 : 한 차원에 대한 선형 회귀를 기반으로 중간 오류를 수행 할 수있는 함수가 있습니까?
여러 가지 범주 형 변수가 포함 된 팬더 데이터 프레임이 있습니다. 예를 들면 : import pandas as pd
d = {'grade':['A','B','C','A','B'],
'year':['2013','2013','2013','2012','2012']}
df = pd.DataFrame(d)
나는 다음과 같은 속성을 가진 Mult
나는 Stockcode와 pandas.DataFrame과 양이 : 나는 양을 곱한 pandas.get_dummies()를 얻을 수있는 솔루션을 찾고 있어요 >>>df
StockCode Quantity
0 85123A 6
1 71053 6
2 84406B 8
3 84029G 6
4 84029E 6
. 나는 그 같이한다 기대하고있
컨텍스트 : 주식 거래 전략 백 테스터를 구축 중입니다. OHLCV 데이터가 포함 된 2446 개의 CSV가 있습니다. 각 CSV는 데이터의 1 거래일입니다. 퍼포먼스가 문제가 된 후에도이 파일들을 약 140 만 줄의 단일 CSV로 연결했습니다. 나중에 그 이상. 개발 초기에는 pd.read_csv를 사용하여 각 파일을 한 번에 하나씩 읽고 각 데이터 프레
저는 데이터 과학에 익숙하지 않고 데이터 간의 관계를 탐구하고 싶습니다. 556784 X 60 개의 행과 열을 포함하는 매우 큰 데이터 집합이 있습니다. 신경망에 공급하기 위해 무시할 변수가 있습니다. 선형 사용 & & 다중 배제을 사용하면 Xlabel과 Ylabel 간의 관계를 찾을 수 있습니다. 그러나 거대한 데이터 세트에서 회귀 분석 기법을 사용하면
팬더와 PyPDF2를 사용하여 몇 가지 PDF 파일을 병합하는 데 이상한 출력 파일이 있습니다. 나는 하나의 페이지를 가지고있다. PDF (certificate) 나는 모두에게 공통적 인 2 페이지짜리 문서와 병합해야한다. 그런 다음 원본 파일에 지정된 사람의 결과 출력 파일 이름을 지정하십시오. 필자가 자동화하고자하는 합리적인 숫자가 있으므로 나는 파이썬