나는 모든 유형의 "파일, file_get_contents, fopen, opendir 등"을 사용하여 내가 삼중으로하는 것을 성취하려고 노력했지만 나에게는 할 수있는 일이 없다. , 이것은 슬프게도 나의 이해 beyong 간다. 그러나 여기서 나는 배울 것입니다. 내가 원하는 것을 원하십니까? 나는 LucidWorks와 함께 일하고 있으며 "C : //
LucidWorks 웹 데이터 원본을 구성하여 특정 파일 형식 만 인덱싱하려고합니다. 그러나 ~ .*\.html까지 경로를 포함 시키면 .html 파일 만 크롤링되며 (단순화 된 예로) 최상위 폴더 만 인덱싱됩니다. 크롤링 깊이은 -1으로 설정하고 경로를 포함하면 경로을 포함하면 예상대로 전체 하위 트리가 크롤링됩니다. 나는 creating a web da
웹에서 액세스 할 수있는 수천 개의 파일 시스템이 있으며 Solr (Lucidworks와 함께)에서 색인을 생성해야하는 수천 개의 PDF 파일이 있습니다. 각각에 해당하는 데이터가 포함 된 XML 파일이 있습니다. XML에는 ID, 간단한 메타 데이터 및 해당 PDF의 URL이 파일 시스템에 포함됩니다. 현재 Solr이 PDF의 URL을 포함하여 필요한 모
Lucidworks 2.5 엔터프라이즈 검색을 야외 또는 문서로 CMIS 준수 리포지토리에 통합하려고하지만 동일한 데이터 소스/커넥터를 볼 수 없습니다. 하지만 Lucidworks 사이트에서 @http://www.lucidworks.com/about-us/press-releases/application-developers-worldwide-endorse-l