2017-01-10 4 views
0

고객으로부터 동일한 청구 형식의 청구서를 항상 많이 받으므로 특정 회계 형식으로 조작하여 회계 시스템으로 가져와야합니다.맞춤 스크립트를 능률화하기위한 PDF

이 작업을 수행하는 데 가장 적합한 코딩 언어는 무엇입니까?

감사합니다,

답변

0

까다로운 부분은 PDF 밖으로 정보를 얻고있다처럼 소리. 이를 위해 OCR을 사용할 수 있습니다. 그런 작업이 완료되면 VBA (Office Automation)를 사용하여 Excel로로드 할 수 있습니다.

대부분의 OCR API는 텍스트뿐만 아니라 단어의 좌표 (경계 상자)도 반환합니다. 여기에 무료 OCR.space OCR API의 예는 다음과 같습니다

이 API 출력이 같은 JSON 응답입니다 : 같은 기능을

{ 
    "ParsedResults": [ 
    { 
     "TextOverlay": { 
     "Lines": [ 
      { 
      "Words": [ 
       { 
       "WordText": "TEXT", 
       "Left": 279, 
       "Top": 89, 
       "Height": 40, 
       "Width": 107 
       } 
      ], 
      "MaxHeight": 40, 
      "MinTop": 89 
      }, 
      { 
      "Words": [ 
       { 
       "WordText": "WALKING", 
       "Left": 233, 
       "Top": 144, 

다른 API를 구글 클라우드 비전, 마이크로 소프트인지 서비스 및 ABBYY 될 것이다.

다음 단계로 JSON 파일을 구문 분석하고 특정 x/y 범위 내에있는 정보를 찾고이를 Excel의 특정 필드에 지정할 수 있습니다.

+0

감사합니다. –