2013-03-20 2 views
1

현재 Zementis ADAPA 또는 UPPI 플러그인을 hadoop 클러스터에 배포하는 방법을 모색 중입니다. SAS 모델을 PMML로 추출하여 배포 할 계획입니다.PMML의 간단한 규칙

그러나 SAS에서 추출한 모델 외에 PMML에서보다 단순한 '모델'/ 분류 규칙을 표현해야합니다.

예는 다음과 같습니다

input: var1, var2 
rule: var1 >= var2 
output: 'true' of 'false' 

나는 현재 (PMML에있는 TreeModel) 아주 간단한 의사 결정 트리로이 표현 생각하고 또는 (PMML에서 규칙 집합) 매우 간단한 규칙 집합.

여기 내 질문은 :

  1. 내가 올바른 모델을 사용하고 있습니까?
  2. 이 방법이 올바른 방법일까요? PMML에서 규칙을 표현하는 또 다른 방법이 있습니까?
  3. PMML에 대해 묻는 것이 옳은가? 이런 규칙을 표현하기 위해 PMML을 사용하는 사람이 있습니까?
+0

형식 수정에 감사드립니다! c4p! –

답변

1

PMML 문서에는 '일종의'모델이 존재할 것으로 예상되므로 더미 회귀 모델을 사용하여 본질적으로 속임수를 사용해야합니다. 그런 다음 입력 필드 사전 처리 (TransformationDictionary)에서 PMML 'if-then-else'구문을 사용하여 '규칙/논리'를 수행하여 응답 필드를 '파생'시킵니다. 그런 다음 'output'요소를 사용하여이 파생 필드를 출력해야합니다.

나는 이것이 너무 적은 이익을 위해 너무 많은 일을한다는 것을 알고있다. 나는 이것을 개념 증명 (proof-of-concept)과 똑같이했으며 PMML에서 간단한 규칙을 수행하기로 결정했습니다.