컬럼을 기반으로 한 csv 파일 분할

컬럼 수에 따라 분할하려고하는 csv 파일이 있습니다. 원본 파일에는 약 24000 개의 열이 있으며이 파일을 고정 된 수의 열 (예 : 1000)을 가진 각 파일과 함께 파일로 분할하려고합니다. 개별 파일에 대해 weka에서 기능 선택을 실행하고 싶습니다. 나는 파이썬에서 다음 코드를 가지고있다.컬럼을 기반으로 한 csv 파일 분할

import pandas as pd 
import numpy as np 

i=0 
df=pd.read_csv("glio.csv") 
#row_split=int(input("Enter the Row Split: ")) 
row_split=6000 
name ="temp_file_" 
ext=".csv" 
rows, columns = df.shape 
df_temp=df.iloc[:,:row_split] 
df_temp.to_csv(name+str(i)+ext) 
i=i+1 
while(row_split<columns): 
    df_temp=df.iloc[:,row_split+1:row_split+100] 
    df_temp.to_csv(name+str(i)+ext) 
    i=i+1 
    row_split+=1000

예상대로 개별 파일을 생성하지만 분할 후 나는 weka에서 개별 파일을로드 할 수 없습니다. 나는 다음과 같은 오류

나는이 새로운 오전 및이 발생하는 이유를 전혀 모르는를 얻고있다. 온라인에서 답을 찾을 수 없습니다.

또한

df_temp.to_csv(name+str(i)+ext, index=False)

CSV 파일의 스크린 샷을 업로드하십시오 : 누군가가 이런 일이 왜 모두의

출처

2017-01-29 Mohamed Shakeel

불행히도 귀하를 돕기에 충분한 정보를 제공하지 않습니다. 문제는 데이터를 작성하는 방식이나 'weka'를 사용하는 방식과 관련이 있거나 다른 것일 수 있습니다. 소규모 데이터 세트로 프로그램을 테스트하고 대량의 볼륨을 처리하기 전에 예상 결과를 쉽게 제어 할 수 있도록하는 것이 좋습니다. – holdenweb

AndreyF의 답변으로 문제가 해결되었습니다. –

첫째는 to_csv 호출 = 거짓 인덱스를 추가 수정하는 방법을 설명 할 수 있다면 정말 도움이 될 것입니다 일부 CSV 뷰어 응용 프로그램 (예 : Excel)에서 열 때.

출처

2017-01-29 13:42:11 AndreyF

컬럼을 기반으로 한 csv 파일 분할

답변

관련 문제