우선 데이터 가져 오기에 일하고 있어요
R의 data.frames (텍스트 마이닝) 단어를 교체 그것. 나는
a[[1]][1:3]
당신이 구조를 참조 할 경우
rawData = sqlQuery(dwhConnect,sqlString)
a = data.frame(rawData$ENNOTE_NEU)
: 여기
는 내가 가진 무엇을 좀 데이터와 청소를하고 싶은 이제[1] lorem ipsum li ld ee wö wo di dd
[2] la kdin di da dogs chicken
[3] kd good i need some help
을 내 자신의 사전. 예 리튬을 대체하는 것입니다 및 KD뿐만 아니라 kdin
내 문제가 전체 데이터 프레임 동안 그 작업을 수행하는 방법이다 쿤데 와가 lorem ipsum의 와.
for(i in 1:(nrow(a)))
{
a[[1]][i]=gsub(" kd | kdin " , " kunde " ,a[[1]][i])
a[[1]][i]=gsub(" li " , " lorem ipsum " ,a[[1]][i])
...
}
그러나 많은 데이터에서 느립니다.
더 좋은 방법이 있습니까?
은 환호 당신은 루프를 필요가 없습니다 캡틴
시도해 볼 수있는 옵션이 있습니까? SQL에서 직접 수행하거나 R에서 SQL 명령을 호출 할 수 있습니까? – daroczig
SQL 및 gsub 아이디어는 지금까지는 훌륭했습니다. 속도가 중요한 경우 Rcpp에 사용자 지정 함수를 작성할 수도 있습니다. –