2013-12-10 3 views
0

나는 스캐너로 스캔되는 많은 스캔 된 컨텐트 아이템을 가지고있다. &은 pdf/image로 변환되고 마지막으로 야외 저장소에 저장된다.야외에서 스캔 한 콘텐츠의 내용을 읽는 방법은 무엇입니까?

메타 데이터 속성을 사용하여 검색된 항목을 검색 할 수 있지만 스캔 한 문서에 저장된 콘텐츠를 통해 검색 할 수있는 방법에 대해 도움을받을 수 있습니다. 예 : 사용자 정보가 가득 찬 양식을 스캔했습니다 & 그 특정 사용자의 이름으로 야외로 검색하고 싶습니다.

어떻게 가능합니까? 스캐너 끝 부분에 최대한 가깝게 만들 수있는 방법이 있습니까?

답변

1

나는이 통합이 자동으로 모든 필드에 매핑을 가지고 있으며,이 모델은 스캔에 연결되어 자동으로 사용자 정의 컨텐츠 모델에 채워집니다 스캔 한 내용의 텍스트 내용을 포함하여 모든 세부 사항을 캡처 할 수 있습니다 Kofax에 &를 사용하여 콘텐츠를 스캔 &를 통합 할 수 있습니다 함유량. 일단 완료되면, 사용자가 동일 항목을 검색 할 수있는 야외 인덱싱을 수행하게됩니다.

또한 kofax가 스캔, 가상 ReScan (VRS), 인식 (OCR/OMR/ICR), 유효성 검사, 검증, 품질 제어, PDF 생성기 등과 같은 많은 구성 요소를 제공한다고 가정합니다. 이 구현에 사용하기 위해 이들을 구성하십시오. 예 : 품질 모듈을 구성하여 콘텐츠를 검색하는 동안 생성 된 오류를 볼 수 있습니다. 추가로 alfresco + Kofax 통합을 찾고 있으므로 Kofax OOTB &에 의해 이러한 기능이 제공된다고 가정합니다. 정의 된 콘텐츠 모델에 따라 콘텐츠 &을 저장하기 위해 스캔 한 콘텐츠를 알프레소 콘텐츠 저장소에 매핑해야합니다.

+0

또한 스캔 한 모든 컨텐츠를 pdf로 만들면 스캔 한 컨텐츠의 텍스트를 별도로 저장하는 작업을 단순화 할 수 있습니다. 일단 컨텐츠가 스캔되어 pdf로 변환되고, 마지막으로 야외 레포에 저장되면, 야외물은 그러한 모든 pdf 컨텐츠를 자동으로 색인 할 수 있습니다. – Finn

1

스캐닝 소프트웨어에 EpheSoft 또는 Kofax를 사용하십시오. 두 제품 모두 Alfresco와 통합되어있어 자동으로 필드를 인식하고이를 Alfresco 모델에 매핑 할 수 있습니다.

이 프로세스를 완료 한 후에는 이러한 특정 필드를 검색 할 수 있습니다.

+0

이 통합은 kofax/ephesoft를 사용하여 콘텐츠를 검색 할 수 있음을 의미합니다.이 통합은 자동으로 사용자 지정 콘텐츠 모델에 채워질 스캔 된 콘텐츠의 텍스트 콘텐츠를 포함하여 모든 세부 정보를 캡처 할 수 있으며이 필드는이 모든 필드에 매핑되어 있으며이 모델은 스캔 됨 함유량. 일단 완료되면, 사용자가 동일 항목을 검색 할 수있는 야외 인덱싱을 수행하게됩니다. – Finn

+0

예! 먼저 Alfresco에서 원하는 필드로 모델을 정의해야합니다. 그런 다음 스캔 소프트웨어에서 템플릿을 정의한 다음 매핑을 만들어야합니다. –

0

탐색 할 수있는 옵션이 많이 있지만 OCR을 스캔 한 내용에 대해 수행해야하며 OCR에서 추출한 텍스트를 PDF에 저장해야합니다 (PDF를 사용하는 경우) Alfresco에 메타 데이터 또는 전체 텍스트로 저장해야합니다.

OCR 텍스트를 PDF에 저장하면 Alfresco는 사용되는 콘텐츠 유형이 콘텐츠의 전체 텍스트를 색인하도록 지정하는 한 콘텐츠 변환자를 사용하여 텍스트를 추출 할 수 있습니다.

당신이 원하는 것을 성취하기 위해 여러 가지 옵션을 사용할 수 있지만 솔루션을 스캐너에 가까이 두려면 지능형 문서 캡처 및 처리에 사용되는 Ephesoft와 같은 캡처 솔루션을 조사해야합니다. . 다른 솔루션 (예 : Kofax)을 사용할 수도 있고 Tesseract를 사용하여 자체 솔루션을 구현할 수도 있습니다.

+0

나는 OCR이 스캐너의 끝에서만 가능하고 사용자 정의 컨텐츠 모델을 사용한다고 가정하고,이 OCR 텍스트를 스캔 한 컨텐츠에 첨부하거나 ephesoft 나 kofax와 같은 스캐닝 솔루션을 통해 이러한 기능을 제공 할 수 있기를 바랍니다. – Finn