2016-06-28 5 views
0

: 구입 있었는지에 대한 설명입니다 제품 설명 및 UUID 각 트랜잭션의 고유 한 ID입니다 개인으로부터. 즉 하나의 UUID에 대해 여러 가지 Desc가 될 수 있다는 것을 의미합니다.R 연역적 기능의 상관 관계 나는 folowing 열이 나는 가지고 CSV에서 연관 규칙 발견하기 위해 노력하고있어

내가 찾고자하는 연결 규칙의 유형은 많은 다른 UUID에 2 개의 Desc가 있다는 것을 보면, 예를 들어 고기와 맥주라고합니다. 규칙 말을 밖으로 보여줄 것이다 : 그것의 지원, 자신감과 리프트 {고기} => {맥주}.

csv로는 여기에서 찾을 수 있습니다 : 난 할 노력하고있어 것은 https://github.com/antonio1695/RStudio/blob/master/facturas_du.csv

:

: 그럼에도 불구하고

libary(arules) 
df <- read.csv("facturas_du.csv") 
rules <- apriori(df_du,parameter=list(support=0.01,confidence=0.3)) 

,이 유형의 거의 지원 규칙 나에게 연결을 제공합니다 내가 무엇을 찾고 있어요되지 않습니다

{An UUID} => {A Desc} 

.

UUID  DESC 
123  Meat,Beer 

나는 누군가가 나에게 무엇을 찾을 도움이 될 희망 :

나는 나의 트랜잭션 ID를하고 같은 것을 가지고 내 UUID를하고 싶습니다. 감사!

답변

1

UUID는 항목 안된다. 데이터를 사용하는 방법과 방법을 확인하려면 먼저 데이터를 수동으로 트랜잭션으로 변환해야합니다. 현재 수행중인 작업은 다음과 같습니다.

library(arules) 
df <- read.csv("https://raw.githubusercontent.com/antonio1695/RStudio/master/facturas_du.csv") 
head(df) 
         Desc         UUID 
1       CONSUMO 38BD37F1-06E9-476B-8779-E6E8139B2586 
2   CONSUMO DE ALIMENTOS 2BE26034-ED04-407A-ACE7-51764EEBE8CF 
3   CONSUMO DE ALIMENTOS 9b24977d-8e67-4b0f-a55f-c0e886561b9d 
4 PAGO POR USO DE ESTACIONAMIENTO 6FAEBEF1-2CCB-4DAB-BD2F-E765EC093F56 
5  COPIA CARTA B&N 1-99 HOJAS 4D3F3204-3699-42DE-A97B-8D0F990B54A5 
6 IMPRESION CARTA B&N 1-99 HOJAS 4D3F3204-3699-42DE-A97B-8D0F990B54A5 

trans <- as(df, "transactions") 

inspect(head(trans)) 
    items          transactionID 
1 {Desc=CONSUMO,           
    UUID=38BD37F1-06E9-476B-8779-E6E8139B2586}    1 
2 {Desc=CONSUMO DE ALIMENTOS,        
    UUID=2BE26034-ED04-407A-ACE7-51764EEBE8CF}    2 
3 {Desc=CONSUMO DE ALIMENTOS,        
    UUID=9b24977d-8e67-4b0f-a55f-c0e886561b9d}    3 
4 {Desc=PAGO POR USO DE ESTACIONAMIENTO,     
    UUID=6FAEBEF1-2CCB-4DAB-BD2F-E765EC093F56}    4 
5 {Desc=COPIA CARTA B&N 1-99 HOJAS,       
    UUID=4D3F3204-3699-42DE-A97B-8D0F990B54A5}    5 
6 {Desc=IMPRESION CARTA B&N 1-99 HOJAS,      
    UUID=4D3F3204-3699-42DE-A97B-8D0F990B54A5}    6 

나는 이것이 당신이 원하는 것이라고 생각하지 않습니다. 각 거래는 하나의 상품과 하나의 UUID의 조합이 아니라 일련의 항목이어야합니다. 내가보기 엔 당신이 arules package vignette을 읽어 보시기 바랍니다.

+0

예, 정확히 UUID가 내 거래 ID입니다. 내가 그것을 어떻게 변경합니까 그래서 나는 UUID 제품 설명 (123) 고기, 아마 맥주 –

+0

을 할 수있는 가장 쉬운 방법은 단일로 설정 형식 read.transactions를 사용하여 데이터를 읽을 수있다라는 dataframe을 가질 수 있습니다. 패키지 비 네트를 읽으면 정말 도움이 될 것입니다! –

+0

많은 독서 후, 나는 그것을 얻었다, 고마워! @ 마이클 하 슬러 –