스파 스 매트릭스 용 스토리지로 svm light 파일을 사용하고 있습니다.xgboost에서 Dmatrix가 svm 라이트 텍스트 파일을 너무 빨리로드하는 이유
시험 항목은 570,601,944
import xgboost as xgb
dtrain = xgb.DMatrix(train_file)
사용 21초와 31700108x54070 행렬위한
from sklearn.datasets import load_svmlight_file
x_train, y_train = load_svmlight_file(train_file)
방법보다 빠르게
가 7분 사용을 보여준다.코드를 해킹하기 전에 누구나 대답 할 수 있습니까?
load_svmlight_file 함수를 향상시킬 제안이 있습니까?
대단히 감사합니다!