아무런 성공없이 ManifoldCF에서 FileNet에 연결하려고합니다. 내가 가진 오류는 다음과 같습니다. Connection status: Connection temporarily failed: Connection refused to host: 127.0.0.1; nested exception is: java.net.ConnectException: Co
10TB 이상의 데이터를 크롤링하고 색인을 생성해야하는 프로젝트를 진행 중입니다. 적은 시간이 소요되는 증분 크롤링을 구현해야합니다. 내 질문 : 모든 대형 조직이 자바와 함께 사용하는 가장 적합한 도구는 어느 것입니까? 나는 Solr과 Manifold CF를 사용해 보았지만 Manifold는 인터넷에 관한 문서가 거의 없다. 오픈 소스JSOUP 및 Sol
웹 사이트를 크롤링하려고합니다. 즉 ManifoldCF에 SAML 인증이 있고 을 사용하고 크롤링 된 데이터를 Apache Solr에 색인을 생성하려고합니다. 그러나 URL을 크롤링하면 로그인 페이지로 302 리디렉션이 표시되고 RESPONSECODENOTINDEXABLE이라고 표시됩니다. 제대로 인증 받았는지 확실하지 않습니다. manifoldCF에는 H