2017-12-04 25 views
0

다음 I는이 서브 세트 한강조 단어

Word Frequency 
    big 10 
    upgrade 10 
    worth 10 
    latest 9 
    much 9 
    phone 8 
exciting 8 
    back 7 
    colours 7 
    case 6 
    stylish 6 
    clear 6 
experience 5 
    time 5 

다음과 같이 I는 용어 문서 행렬을 만들었

Subject     Response Rate(%)  Campaign Type Channel 
    Buy Stunning Phone A  81.00     A   e-mail 
Special Emi OFFER    81.00     B   e-mail 
Buy Stunning Phone at EMI  73.00     C   SMS 
The game changer is here.  85.00     A   SMS 
Buy Stunnig Phone A   80.00     A   SMS 
Special Emi OFFER    88.00     B   e-mail 
Buy Stunning Phone at EMI  48.00     C  e-mail 
The game changer is here.  48.00     A   e-mail 
Buy Stunning Phone    89.00     A   e-mail 
Special Emi OFFER    89.00     B   SMS 
Buy Stunning Phone at EMI  69.00     C   SMS 

캠페인 데이터 dataframe은 databy dplyr 기반 채널 유형의 응답 속도가 감소합니다. 각 주제에 대해 용어 문서 행렬의 단어를 강조 표시하거나 나열하고 싶습니다. 단어가 주제에 있다면, 주제 옆에 별도의 목록으로 나열됩니다. 나는 이것을 할 길을 찾을 수 없다.

+1

는 "하이라이트"무엇을 의미합니까 같은 것을 의미합니까? – PoGibas

+0

질문을 편집하고 사용했던 코드를 추가하십시오. – Heikki

답변

1

당신이

library(dplyr) 

df <- read.table(header = TRUE, sep = "," ,text = "Subject,Response Rate(%),Campaign Type,Channel 
Buy Stunning Phone A,81.00,A,e-mail 
Special Emi OFFER,81.00,B,e-mail 
Buy Stunning Phone at EMI,73.00,C,SMS 
The game changer is here.,85.00,A,SMS 
Buy Stunnig Phone A,80.00,A,SMS 
Special Emi OFFER,88.00,B,e-mail 
Buy Stunning Phone at EMI,48.00,C,e-mail 
The game changer is here.,48.00,A,e-mail 
Buy Stunning Phone,89.00,A,e-mail 
Special Emi OFFER,89.00,B,SMS 
Buy Stunning Phone at EMI,69.00,C,SMS",) 


df2 <- read.table(header = TRUE, sep = "," ,text = "Word,Frequency 
big,10 
upgrade,10 
worth,10 
latest,9 
much,9 
phone,8 
exciting,8 
back,7 
colours,7 
case,6 
stylish,6 
clear,6 
experience,5 
time,5",) 

m = sapply(df2$Word %>% as.character() %>% trimws(),regexpr,text = df$Subject %>% as.character(),ignore.case = TRUE) 

df$keyWord <- sapply(1:nrow(m),function(idx){ 
t = m[idx,] > 0 %>% unlist() 
paste0(names(t)[t],collapse = ",") 
}) 
df 
+0

이것은 잘 작동합니다. 하지만 단어가 목록에 표시되지 않습니다. –

+1

@VishnuRaghavan 안녕하세요, 죄송합니다. 코드를 복사하여 붙여 넣을 때 첨부 된 코드에 버그가있었습니다. 다시 시도하고 작동하는지 확인하십시오. –

+0

친애하는 @BBertil Nestorius. 지금은 효과가있는 것 같습니다. 감사합니다 –