저는 Delphi/Sql Server로 작성된 클라이언트 서버 DMS를 관리합니다.가능한 한 많은 파일 유형의 txt 콘텐츠를 검색합니다.
사용자가 db에 저장된 모든 문서 내에서 문자열을 검색 할 수있게하고 싶습니다. (파일은 blob로 저장되며 공간을 절약하기 위해 압축 파일로 저장됩니다).
내 아이디어는 "checkin"에 색인을 붙이는 것이므로 nwe 파일을 저장하면 텍스트 정보가 모두 추출되어 새로운 DB 필드에 저장됩니다. 그래서 어떻게 든 내 파일 테이블은 다음과 같습니다
ID_FILE integer
ZIPPED_FILE blob
TEXT_CONTENT text field (nvarchar in sql server)
나는 그런 적어도 가장 일반적인 텍스트와 같은 파일의 "색인"을 지원하고자
: PDF, TXT, RTF, 문서, DOCX, PDF가 될 수를 xls와 xlsx, ppt, pptx를 추가합니다.
MS Office 파일의 경우 alerady가 내 응용 프로그램에서 ActiveX를 사용할 수 있으므로 txt 파일의 경우 파일을 읽을 수 있지만 pdf 및 odt는 읽을 수 있습니까?
"가장 두려워하지 않는"모든 파일 유형을 구문 분석하는 최고의 techinque 또는 타사 구성 요소 (무료가 아님)를 제안 해 주시겠습니까?
감사
인덱싱이 클라이언트에서 수행되고 사용자가이 기능을 작동하도록 사무실을 설치하도록 강요하고 싶지 않기 때문에 이상적으로 ActiveX를 피하는 것이 꿈일 것입니다. 이것이 타사의 제안이 아닌 가난한 구성 요소를 요구하는 이유입니다 (btw 내가 "독자"구성 요소가 필요합니다) – LaBracca
Gnostice PDFtoolkit 4.0 VCL PDF 파일을 당신을 위해 할 수 있거나, 파일을 사용하여 저를 위해 할 수 있습니다. – Despatcher
코멘트 주셔서 감사합니다. 제게 "당신이 기대하는대로 텍스트를 얻지 못했습니다"에 대해 더 설명해 주시겠습니까? (단순한 아이디어이지 기술적 인 답변이 아닌가요?) – LaBracca