2014-09-17 4 views
0

Apriori 알고리즘은 지원 임계 값을 충족하는 모든 빈 항목 집합을 먼저 찾은 다음 자주 신뢰하는 최소한의 신뢰도를 가진 빈 항목 집합에서 강력한 연관 규칙을 생성합니다.arules에서 한 단계 대 두 단계의 병합 규칙 마이닝 - 왜 다른가?

따라서 나는 R 패키지 arules에 그 기대 :

txs <- as(inputDataTable,"transactions") itemsets <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="frequent itemsets")) rules <- ruleInduction(itemsets)

txs <- as(inputDataTable,"transactions") rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))

이 같은 규칙으로 이어질 것이다, 그러나 더 규칙은 두 번째 예에서 발견된다 나는 왜 그런지 이해할 수 없다.

누구에게 설명 할 수 있습니까? 나는 잠시 동안 그 주위에 내 머리를 얻으려고하고있다. ..

+0

추가 규칙이 맞습니까? 버그가있을 수 있습니다. 확인하기 쉬워야합니다. –

+0

그것을 발견, 바보, 아래를 참조하십시오. –

답변

0

Ok .. 지금 나는 꽤 어려웠다.

비슷한 문제가 발생한 사람에게. 문제는 (물론) 모든 항목 집합을 찾을 때가 아니라 ruleInduction() 단계에서 자신감을 설정해야한다는 것입니다. 지원 만이 관련성이 있습니다. ruleInduction() 단계에서 자신감에 가치를 부여하지 않았으므로 신뢰도 기본값 0.8을 사용 했으므로 규칙을 찾지 못했습니다.

그렇게 :

txs <- as(inputDataTable,"transactions") itemsets <- apriori(txs, parameter = list(support = 0.05, target="frequent itemsets")) rules <- ruleInduction(itemsets, confidence = 0.7)

txs <- as(inputDataTable,"transactions") rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))

같은 결과로 이어질 않습니다. :)