2014-04-24 4 views
0

제목에서 알 수 있듯이, 하나의 PDF에서 모든 텍스트를 가져 오는 자동 스크립트를 만들고 싶습니다. 페이지를 복사하여 Google 번역본에 붙여 넣은 다음 번역 된 텍스트를 다른 Microsoft Word 문서로 복사하십시오.텍스트의 페이지를 복사하여 Google Translator에서 번역하여 Word에 붙여 넣기위한 자동화 스크립트 작성

PDF에 많은 페이지가 (150+ 이상) 있기 때문에 자동화 된 스크립트를 사용하는 것이 더 쉽다고 생각했습니다.

어떤 언어를 사용해야할까요?이 스크립트를 사용하여 실제로 시간을 절약 할 수 있습니다 (처음에는이 코드를 배워야 함을 의미하지만 일부 프로그래밍이 필요함). 경험 (나는 C++, Javascript, PHP를 알고있다.), 그러나 나는 알고리즘 (Flood Fill, ...)과 같은 강력한 이해력을 가지고 있지 않다.

미리 감사드립니다.

편집 : AutoIt을 스크립팅에 사용할 수 있다는 것을 알았지 만 AutoIt 또는 Powershell을 사용하는 것이 더 좋을지 모르겠다 ... 다른 사람을 만들 수있는 무언가를 배우고 싶다. 스크립트 (예 : Camtasia Studio에서 수행하는 일부 프로세스 자동화) ... AutoIt 또는 Powershell?

답변

1

AutoIt 사용자로서 AutoIt이라고 말하고 싶습니다.

PDF에서 텍스트를 복사하는 것은 생각만큼 쉽지 않습니다. 당신이 this 같은 간단한 방법을 사용하여 텍스트를 얻을 수 있도록

  • 대부분의 PDF 파일은 파일 자체의 텍스트의 대부분을해야합니다 : 마일리지는 PDF가 생성 된 방법에 대한 다양하며, 당신이 사용할 수있는 여러 가지 방법이 있습니다
  • This method은 zlib을 사용하여 pdf에 대해 작업을 수행합니다. 내가 그것을 결코 시도하지 않고 있었던 것에 따라 무엇이 확실하지 않은.
  • 타사 프로그램을 사용하여 여러 가지 좋은 예가 있습니다. 하나는 using Debenu이고 다른 하나는 using XPDF
  • 입니다. 곡예사와 같은 다른 프로그램을 자동화 할 수 있어야합니다. 이미 AutoIt에 싸여 있다는 사실을 알지 못해도 사용할 수있는 API가 있습니다.

나머지 요구 사항과 마찬가지로, Google 번역본을 번역 할 UDF가 here이며, UDF라는 단어는 AutoIt 설치와 함께 제공되는 표준 단어입니다.

+0

Camtasia에서 생산 과정 자동화에 AutoIt을 사용 하시겠습니까? – user2754850

+0

AutoIt을 사용해보십시오. 나는 당신이 그것의 목적에 매우 잘 부합한다는 것을 알게 될 것이고, 나는 camtasia를 자동화하는 것이 전혀 문제가 아닐 것이라고 확신합니다. 나는 결코 그것을 사용하지 못했기 때문에 나는 파워 쉘에 대해 말할 수 없다. – Matt