0
데이터 집합이 20,000,000 개입니다. 각 행에는 30 개의 열이 있습니다.트리 분리 한 열의 고유 한 값을 기반으로하는 회귀 모델
하나의 열에 고유 한 7000 개의 제품 번호가 있습니다.
각 행에는 단가 이외의 모든 열을 사용하여 예측할 단원 비용 값이 포함되어 있습니다.
각 제품 번호에 대한 데이터를 모델링하기 위해 고유 한 의사 결정 트리 또는 고유 한 의사 결정 트리 분기를 만들고 싶습니다.
기본적으로 각 제품 번호에 대한 행을 분할하고 각 제품 번호를 개별적으로 모델링합니다.
가능한 경우 Azure에서 단일 모델을 교육하고 싶습니다.