2016-06-22 3 views
-1

들어오는 자동차 대여를 분류해야하지만, 훈련에 사용할 수있는 나의 역사적인 데이터는 "그룹화 된"형식이므로 분류 모델을 어떻게 훈련시킬 수 있는지 알 수 없습니다.분류 접근법에 대한 조언

내 들어오는 데이터는 자동차 모델, 수량 및 단가의 목록입니다 :이 들어오는 데이터는 현재 수동으로 분류되어 클래스와 그룹 당 총 가격별로 그룹화되어 저장

Chevrolet Spark, 1, 196.91 
Fiat 500, 1, 196.91 
Toyota Prius Hybrid, 3, 213.73 

(시보레와 피아트가 경제입니다, 프리우스는) 하이브리드입니다 :

Economy, 393.82 
Hybrid, 641.19 

이 문제는 기계 학습에 의해 분해 할 수 있어야하지만 감독 분류에 대한 학습 집합을 구축하는 방법을 알아낼 수 없습니다. 어떤 조언도 감사하겠습니다.

감사

답변

0

순진 베이 즈 분류 당신이 업적 사용하고 이미 태그가 무엇을 배울으로 ... 당신은 가격을 사용할 수 있습니다 무엇을하려고해야한다.

그러나 나는 당신이 하나의 그룹에서 다른 개체로 항상 많은 개체를 가지고 있지 않기 때문에 TOTAL 가격을 사용하여 일관된 데이터를 가질 수있는 방법을 얻지 못했습니다 ... 단가를 사용해야합니다.

+0

문제는 제가 태그가 달린 것이 없으며, 피아트는 다른 곳에서 사용자의 머리/종이처럼 이코노미로 태그 지정되어 있지 않다는 것입니다. 아니면 내가 너를 오해 하는가? –

+0

@joe_c 태그가 지정된 열차 세트로 이미 수동으로 분류 한 예제를 사용할 수 없습니까? 편집 : 분류는 종이에만 적용됩니까? 이것을 수동으로 분류하는 사람들은 컴퓨터에서 할 수 없습니까? – Carele

+0

정확하게, 그것은 수동으로 수행되었으며 태그 지정은 아무 곳에도 저장되지 않습니다. 데이터가 종이 (수십 개의 행)에 들어 왔고 많은 행을 펀치하는 대신 데이터를 그룹화하고 그룹화 된 행을 몇 개만 등록하기 때문에 데이터가 비슷합니다. –

0

여러 클래스 분류를 제공하는 알고리즘이 많이 있지만 예측하려는 항목에 대해 자세히 설명 할 수 있습니까? 당신이 작성한 것에서, 그것은 기계 학습 모델보다 ETL 프로세스에 대한 시나리오처럼 들립니다.

자동차 모델이 "Chevy Spark"또는 "Fiat 500"인 들어오는 레코드는 항상 "Economy"라는 레이블이 붙어있는 반면, "Toyota Prius Hybrid" "하이브리드"라고 표시됩니다. 간단한 조회 테이블이 여기 일을 할 것입니다 - 멋진 기계 학습 수학을위한 필요가 없습니다. :)

+0

그룹화 된 내 기록 데이터를 기반으로 자동차의 라벨을 예측하려고합니다 (따라서 조회를 빌드하기 위해 깨끗한 자동차 -> 라벨 데이터가 없음). 당신은 정확하다, Chevy Spark와 Fiat 500는 항상 Economy 등이라고 라벨 될 것이다, 나는 단지 내가 차의 라벨을 확인하기 위해 ML를 사용할 수 있기를 바랐다 :) –