2016-08-26 5 views
2

다음 데이터 프레임이 있습니다 - CTVU.어떻게 arules apriori 출력을 R에서 데이터 프레임으로 변환합니까?

MMGID_5 EMAIL 
2341  [email protected] 
50   [email protected] 
311  [email protected] 
2341  [email protected] 
2387  [email protected] 
57   [email protected] 
2329  [email protected] 
2026  [email protected] 
650  [email protected] 
2369  [email protected] 

나는 다시 첫 번째 열에서 가장 높은 신뢰와 두 번째의 자신감 항목을 포함하는 두 개의 새로운 열이있는 dataframe에, 아래에 만든 규칙을 켜려고합니다.

EMAIL  MMG5_rule Confidence 
[email protected] 50   0.5 
[email protected] 2341  0.2 
[email protected] 2026  0.6 

나는 몇 가지 조사를했지만 해결책을 찾을 수 없습니다 :

library(arules) 
library(arulesViz) 

CTVU <- read.csv("CTVU.csv", header = TRUE) 
CTVU <- unique(CTVU[ , c(2,5) ]) 
CTVU <- as(split(CTVU[,"MMG5_ID"], CTVU[,"EMAIL"]), "transactions") 
itemFrequencyPlot(CTVU,topN=20,type="absolute") 
rules <- apriori(CTVU, parameter = list(supp = 0.001, conf = 0.1)) 
options(digits=2) 
inspect(rules[1:5]) 
rules<-sort(rules, by="confidence", decreasing=TRUE) 
rules <- apriori(CTVU, parameter = list(supp = 0.001, conf = 0.8,maxlen=3)) 

rules<-apriori(data=CTVU, parameter=list(supp=0.001,conf = 0.01,minlen=2), 
appearance = list(default="rhs",lhs="289"), 
control = list(verbose=F)) 
rules<-sort(rules, decreasing=TRUE,by="confidence") 
inspect(rules[1:5]) 

그래서 결국 나는이처럼 보이는 dataframe 있습니다. 다른 사람이 어떻게하는지 알아낼 수 있습니까?

+0

@rcs - 감사합니다. 이렇게하면 규칙이'data.frame'으로 생성됩니다. 예를 들어 고객이 다음에 구매할 가능성이 높은 것을 예측하기 위해 data.frame에 규칙을 적용하는 방법에 대한 제안이 있습니까? – Davis

+0

당신은 recommandlab 패키지를 보길 원할 것입니다. 그것은 규칙 규칙에 기반한 권고 자 (패키지 arules 사용)가 있습니다. –

+0

@MichaelHahsler 감사합니다. 나는 recommenderlab을 살펴볼 것입니다. 내가 지금하고있는 것보다 쉬운 해결책 일 수도 있습니다. – Davis

답변

1

arules 출력을 data.frame으로 변환 할 필요가 없습니다. 당신이 구입 항목의 목록과 함께 새로운 고객이있는 경우 arules::subset와 관련 연관 규칙을 찾을 수 있습니다 subset 도움말이에

newCustomer <- c("toothbrush", "chocolate", "gummibears") 
arules::subset(aprioriResults, subset = lhs %in% newCustomer) 

더 많은 정보를 :

부분 집합 행에서 작동/itemsets/x의 규칙. 부분 집합에 주어진 표현식은 x를 사용하여 평가되므로 항목 (lhs/rhs/items)과 quality data.frame의 열은 해당 이름으로 직접 참조 될 수 있습니다.

레이블로 지정된 항목을 포함하는 항목 집합을 선택하는 중요한 연산자는 % in % (주어진 항목과 일치하는 항목 집합 선택), % ain % (주어진 항목과 일치하는 항목 집합 만 선택) 및 % pin % 어울리는). 그러나

, 고객이 다음입니다 살 가능성이 무엇인지 질문 - 내보기에 - 질문의 많은 순서 마이닝을 사용하여 답변을 얻을 수 있습니다. 다행히도 arulesSequences은 동일한 작업을 수행하는 패키지이며 동일한 작성자가하므로 추가 작업이 거의 필요하지 않습니다.