apache-tika

    1

    1답변

    BLOB의 데이터베이스에 원시 이진 데이터가 저장됩니다 (단어, Excel, xml 파일 제외). TikaEntityProcessor를 사용하여 색인을 생성하려고하지만 아무 것도 색인 생성되지 않습니다. xml/word/excel 파일이 BLOB 필드에 저장되어있는 경우에도 동일한 구성이 작동합니다. <dataSource name="db" driver="o

    2

    1답변

    내 웹 응용 프로그램에서 Mybatis를 사용하며 Tika 기능 (tika-parsers)도 추가하고 싶습니다. 최대한 빨리 응용 프로그램을 배포하고 싶습니다, 나는 다음과 같은 오류 얻을 : 나는 MyBatis로 3.2.2에 대한 종속성이 Task 7 initiated: [Deployer:149026]deploy application fts on Admi

    3

    1답변

    나는 표준 혼자 자바 배치 프로세스를 개발 중이다. Tika Jars를 사용하여 첨부 파일 mimetype을 확인하려고합니다. Tika 1.4 Jar 파일을 사용하고 있습니다. Parser parser= new AutoDetectParser(); InputStream stream = new FileInputStream(fileAttachment); in

    1

    2답변

    Apache Tika를 사용하여 콘텐츠 유형 (예 : .pdf 파일의 경우 application/pdf)을 확인하려고합니다. Apache Tika의 org.apache.tika.detect.NameDetector 클래스를 사용하고 싶습니다. 내 문제는 그것은 감지 메서드는 InputStream 만 받아들입니다. File의 InputStream에 액세스 할

    1

    1답변

    Solr urldatasource는 사용자 이름과 암호를 지원하지 않습니다. SNOW 서버에서 기본 인증을 가진 데이터에 액세스하고 싶습니다. 어떻게해야합니까? 나는 http://username:[email protected]을 시도했다. 하지만이 작동하지 않습니다 나는이 문제에 대한 좋은 documentaion을 찾을 수 없습니다 tika에 대해 어딘가에

    0

    1답변

    이 아파치 티카 전용 구성 파일을 사용하여 구성 할 수 있습니다 섹션 상태를 문서화 : https://cwiki.apache.org/confluence/display/solr/Uploading+Data+with+Solr+Cell+using+Apache+Tika <str name="tika.config">/my/path/to/tika.config</str>

    0

    1답변

    내 문서에서 내용을 추출하기 위해 Apache Tika 1.4를 사용하고 있습니다. org.bouncycastle. * 클래스도 함께 제공되며 Tika 패키지와 충돌하는 다른 버전의 bouncycastle을 사용합니다. Tika가 bouncycastle (bcprov) jar를 사용하는 경우 Maven에서 제외 태그를 사용하여 Tika를 제외 할 수 있지만

    0

    1답변

    구성을 통해 Tika에서 spring-data-solr을 사용하는 방법이 있습니까? 그렇지 않으면 spring-data-solr에 대한 solrj의 ContentStreamUpdateRequest+addfile에 대한 대안이 있습니까? 현재 나는이 방식으로 Solrj + 티카를 사용하고 는 : SolrServer server = new HttpSolrSer

    0

    1답변

    안녕하세요, 명령 줄에서 아파치 tika를 사용하여 페이지 수와 같은 단어 파일에 대한 메타 데이터를 추출하고 싶습니다. 어떻게해야합니까?

    0

    1답변

    java를 사용 중이며 apache tika로 일부 메타 데이터를 추출하려고하는데 'subject'메타 데이터의 예상 값을 초과 할 수 없습니다. 파일은 jpg 이미지입니다. 우선이 같은 파일을 구문 분석하고 있습니다 : inputStream = new FileInputStream(fileToExtract); Parser parser = new