2016-06-30 10 views
0

현재 트위트 언어를 인식하는 방법을 찾고 있습니다. 아파치 라이브러리 tika를 발견했지만 잘 작동하지 않습니다 ... 이제 langdetect를 발견했으며이를 사용하려고합니다. documentation에서 ...LangDetect 프로필이란 무엇입니까?

String path = "my path to the file profiles"; 
       DetectorFactory.loadProfile(path); 
       detector = DetectorFactory.create(); 
       detector.append(tweet); 
       langDetected = detector.detect(); 

답변

0

을 현재, 나는 코드의 샘플을 발견하지만 난 내가 안으로 둘 필요가 모르는 ... 파일 "프로파일"을 무엇인지 이해하지 못하는 :

이 라이브러리를 사용하기 전에 DetectorFactory#loadProfile()을 한 번 호출하여 초기화하십시오.

DetectorFactory.loadProfile(profileDirectory); 이 매개 변수의 매개 변수는 언어 프로필의 파일이있는 디렉터리입니다. 언어 프로파일이이 라이브러리에 번들로 제공되므로 loadProfile() 매개 변수로 저장소에 "trunk/profile"을 지정하십시오.

프로필 파일은 profiles subdirectory

+0

에있는 저장소에 감사합니다! 그것은 작동합니다. jar 파일에서 프로파일을 추출해야했습니다. – Arya