2016-07-11 9 views
2

저는 R에 대한 새로운 프로그래머입니다. 그리고 몇 가지 기사 (.txt)를 폴더에 저장했습니다. 이제 R에서 기사를 가져올 수 있습니다. 두 가지 방법이 있는데 어느 것이 더 낫지는 모르겠습니다.일부 키워드를 사용하여 이러한 키워드가 포함 된 기사를 찾는 방법은 무엇입니까?

여기 내 코드입니다 :

# 1 
library(tm) 
cname <- file.path("D:/magazine_pass") 
docs <- Corpus(DirSource(cname), readerControl=list(reader=readPlain)) 

# 2 
dir.list <- list.files("D:/magazine_pass" , full.name = TRUE) 
for(i in 1:length(dir.list)){ 
     file0 <- dir.list[i] 
     s <- readLines(file0,encoding="ASCII") 
     s <- sapply(s,function(row) iconv(row, "ASCII", "ASCII", sub="")) 
    } 

그리고 이러한 키워드를 포함하는 기사를 찾기 위해 몇 가지 biokeywords(ex.clean energy,wearable device)를 사용하는 것을 시도하고있다. 어떻게해야합니까?

코드를 표시하고 간단히 설명해주십시오. 고마워.

답변

0

label1 = subset(docs, grepl(paste(c("clean energy","wearable device"), collapse = "|"), docs))

이것은 당신의 신체를 통해 살펴보고 grepl 기능 내부의 단어가 포함 된 모든 항목을 꺼내해야한다. 기본 grep 함수는 파일에서 제공된 패턴과 일치하는 문자열 패턴을 검색합니다. grepl은 패턴이 함수 내에서 일치하는지 여부에 대한 TRUE/FALSE의 논리 벡터를 반환합니다.

+0

대단히 감사합니다! – Bruce