1
Apache Tika를 사용하여 .tex
파일에서 텍스트를 추출하려면 어떻게합니까? 예제 파일은 http://www.tug.org/texshowcase/EulerGibbsDuhem.texTika를 사용하여 .tex 파일에서 텍스트를 추출하십시오.
입니다. Tika는 콘텐츠 형식을 application/x-tex
으로 올바르게 감지 할 수 있지만 그 파일에서 아무 것도 추출하지 않습니다. 내가 명령을 시도
java -jar tika-app-0.9.jar -t EulerGibbsDuhem.tex
또한 다음 코드 :
File file = new File(fileName);
Tika tika = new Tika();
String mimeType = tika.detect(file);
pageContent = tika.parseToString(file);
감사합니다. 그런 라이브러리를 찾으면 티켓을 열어 드리겠습니다. – nikhil500