0
컬럼 수에 따라 분할하려고하는 csv 파일이 있습니다. 원본 파일에는 약 24000 개의 열이 있으며이 파일을 고정 된 수의 열 (예 : 1000)을 가진 각 파일과 함께 파일로 분할하려고합니다. 개별 파일에 대해 weka에서 기능 선택을 실행하고 싶습니다. 나는 파이썬에서 다음 코드를 가지고있다.컬럼을 기반으로 한 csv 파일 분할
import pandas as pd
import numpy as np
i=0
df=pd.read_csv("glio.csv")
#row_split=int(input("Enter the Row Split: "))
row_split=6000
name ="temp_file_"
ext=".csv"
rows, columns = df.shape
df_temp=df.iloc[:,:row_split]
df_temp.to_csv(name+str(i)+ext)
i=i+1
while(row_split<columns):
df_temp=df.iloc[:,row_split+1:row_split+100]
df_temp.to_csv(name+str(i)+ext)
i=i+1
row_split+=1000
예상대로 개별 파일을 생성하지만 분할 후 나는 weka에서 개별 파일을로드 할 수 없습니다. 나는 다음과 같은 오류
나는이 새로운 오전 및이 발생하는 이유를 전혀 모르는를 얻고있다. 온라인에서 답을 찾을 수 없습니다.
또한df_temp.to_csv(name+str(i)+ext, index=False)
CSV 파일의 스크린 샷을 업로드하십시오 : 누군가가 이런 일이 왜 모두의
불행히도 귀하를 돕기에 충분한 정보를 제공하지 않습니다. 문제는 데이터를 작성하는 방식이나 'weka'를 사용하는 방식과 관련이 있거나 다른 것일 수 있습니다. 소규모 데이터 세트로 프로그램을 테스트하고 대량의 볼륨을 처리하기 전에 예상 결과를 쉽게 제어 할 수 있도록하는 것이 좋습니다. – holdenweb
AndreyF의 답변으로 문제가 해결되었습니다. –