2017-10-10 12 views
0

데이터 집합 (data.table 패키지를 통해 업로드 됨)의 줄무늬 함수를 약 40000 행의 R로 실행하려하지만, 실행하는 데 오래 걸릴 것입니다. 내 코드는 다음과 같습니다 : 수동으로 프로세스를 중지하는 경우, 그것은 50 개 이상의 경고 표시Stemmer function in R Slow

data[, Description := map(Description, function(k) stemmer(k))] 

: Image Link

을 빠르게 실행할 수있는 대안이 있습니다. 내 컴퓨터에는 8Gb 램이 있습니다. 실행은 10 개 개의 레코드 말에 대한

+0

형태소 분석기를 실행합니다, 당신은 시간의 차이를 확인 했습니까? –

+0

10 줄로 실행하는 것이 더 빠르지 만 대안은 무엇입니까? 전체 데이터에 대해 어떻게해야합니까 ?? –

+0

일괄 처리를 실행 해보십시오. 형태소 분석기는 대형 데이터 세트를 사용하는 데 많은 시간이 걸립니다. 너 사과 할려고 했니? –

답변

0

사용 lapply, 함수는 일반적으로는 시간이 오래 걸립니다에 빠르게