java를 사용 중이며 apache tika로 일부 메타 데이터를 추출하려고하는데 'subject'메타 데이터의 예상 값을 초과 할 수 없습니다. 파일은 jpg 이미지입니다.Apache Tika, 'subject'메타 데이터 값을 검색 할 수 없습니다.
우선이 같은 파일을 구문 분석하고 있습니다 :
inputStream = new FileInputStream(fileToExtract);
Parser parser = new AutoDetectParser();
ContentHandler contentHandler = new BodyContentHandler();
Metadata metadata = new Metadata();
parser.parse(inputStream, contentHandler, metadata, new ParseContext());
하고 난 다음 인쇄하려고 : 여기 내 코드입니다 그래서
metadata.get(Metadata.AUTHOR) --> "MyAuthor"
metadata.get(TikaCoreProperties.CREATOR) --> "MyCreator"
metadata.get(TikaCoreProperties.TITLE) --> "MyTitle"
metadata.get(Metadata.SUBJECT) --> **null**
metadata.get(TikaCoreProperties.KEYWORDS) --> **null**
, 내가 얻을 제대로 모든 값과 나는 그 주제에 대해 널 값을 얻는다. 메타 데이터는 저에게 수동으로 추가되었습니다 (마우스 오른쪽 버튼 클릭 -> 속성, Windows OS).
오전 내가 뭔가 잘못하고?
PS : "TikaCoreProperties.KEYWORDS은"아파치 티카 문서에 따라 주제를 검색하는 또 다른 방법입니다 있습니다.
하지만 임의의 문자열을 라이브러리 메서드에 전달하고 있지 않습니다. 내가 사용중인 코드는 아파치 Tika 문서 (https://tika.apache.org/1.5/api/org/apache/tika/metadata/Metadata.html)를 기반으로합니다. 그래서 제목 필드가 비어 있지 않기 때문에 잘못된 키워드 (Metadata.SUBJECT ...)를 사용하고 있거나 라이브러리가 값을 검색 할 수 없습니다. 이것에 대한 통찰력? – Mario
Tika-App CLI 도구가 파일에 대해'--metadata'로 무엇을보고합니까? – Gagravarr
죄송합니다. 귀하의 의견을 보지 못했습니다. 도구는 주제 값도 검색하지 않습니다. – Mario