2013-02-10 4 views
0

안녕하세요 저는 시스템 검토를하고 결과를 줄 필요가 차트 ... 여기에.NET 프로그램에서 .PDF의 차트에 렌더링 할 수있는 텍스트를 스캔합니다 - 단어가 아닌 값을 위해 - 텍스트 위치 기능?

차트 이미지 ....

example chart .pdf http://imageshack.us/photo/my-images/651/scorecardchartexample.gif/

http://imageshack.us/photo/my-images/651/scorecardchartexample.gif/

--assume이 차트는 .PDF이고 텍스트는 IE를 렌더링 할 수 있습니다. "강조 표시". 즉, 나는 1000 업로드 할 수 있어야합니다 - 차트가 페이지 동일한 방식과 동일한 위치에 차트를 변경할 수 있습니다 --assume마다

에게에 배치 --assume

이 차트는 모두 동일한 형식을 따르지 만 차트에서 차트로 대체 정보가 제공됩니다.

- .NET에서의 VAST 전문 기술 인정 - 실제 텍스트 해석에 대한 전문 지식이 거의 없습니다. ... 나는 이미이 일을하고 편집 가능한 필드가 .PDF를 해석

--assume 전문 지식, 이것은 내가 만든 등

각 필드에 값을 배치 할 수 있었다 .PDF의 제한됩니다 - 이 차트는 하나의 텍스트 렌더링 가능 .PDF로만 제공 될 수 있다고 가정합니다. 즉,이 차트를 작성하는 웹 사이트와 상호 작용합니다.이 웹 사이트에는 상호 작용할 API가 없으므로 웹 페이지에서이 차트를 PDF로 인쇄해야합니다. 우리가 할 수있는 모든 것 ... (정부 웹 사이트)

.NET 시스템을 사용하면 프로그램을 만들거나 기존 응용 프로그램을 .NET 시스템에 통합해야이 차트를 검토 할 수 있습니다. 각각 무엇을 말할 수있다. "X"는 ... 왼쪽 또는 다음 행의 "X"가 다른 결과의 지표임을 나타냅니다. (차트 참조)

검색을 수행하려면 프로그램이 필요합니다. .PDF 문서의 트리거를 기반으로 결과를 반환하거나 폴더를 치는 것. 이 부분은 처음부터 프로그램을 만드는 것으로 가정 할 수 있습니다 ... 그렇지 않으면 우리는 필요에 따라 기존 앱과 상호 작용하는 것으로 제한 될 것입니다.

우리는 다양한 전략에 개방되어 있습니다. 그러한 클래스 나 객체가 있다고 가정하면 X, Y와 같은 문서의 위치를 ​​기반으로 텍스트를 읽는 것을 생각하고있었습니다. 또 다른 바람직한 경로는 일종의 stringBuffer (C# 가정)이지만 차트 눈금 선을 탐색 할 수 있어야하며 "X"의 위치와 "X"의 의미를 정확하게 해석하려면 공백을 계산해야합니다. 게재 위치에 따라 세 번째 옵션, 우리가 알지 못하는 것.

무언가가 존재하고 시도되고 사실이라면 당연히 그게 가장 좋습니다. 그런 다음 .NET 및 C#을 사용하여 인터페이스에 대한 모든 팁을 제공합니다.

미리 감사드립니다. Code Gawds!

답변

0

OK 우리는 ClearImage라는 일부 소프트웨어를 발견 - 가격이 저렴 아니었지만 꽤 깔끔한입니다. Adobe PDF가 문서를 분석하여 양식 필드를 찾는 것과 같은 방식으로 모든 이미지를 분석합니다. 선명한 이미지를 얻은 후에는 "얼룩 (blob)"목록을 얻을 수 있습니다. 그런 다음 각 얼룩의 의미를 지정하고 고유 한 식별자를 지정합니다. 이를 통해 이미지의 "blob"배치를 기반으로하는 자동 값 선언이 가능합니다.

또한 이미지를 "지문 인쇄"로 정렬 할 수 있으므로 동일한 이미지가 나타나면 인식 할 수 있습니다. 내 경우에는 차트에 3 가지 템플릿이 있으며 실제로 각 이미지는 다른 차트로 인해 다르지만 궁극적으로 각 템플릿은 차트의 배수로 동일한 레이아웃을가집니다. 이렇게하면 첫 번째 확인 후 어떤 차트가 입력되었는지 식별 할 수있게되고 각 BLOB를 애니메이징으로 이동하는 데 도움이됩니다.

어쨌든, 다른 사람이이 질문을 접하게되고 이런 유형의 기능이 필요한지 살펴볼 가치가 있습니다. 나는 대답하지 않은 상태로두고 싶지 않았다. 나는 우리가 그것에 대해 더 많이 배울 때이를 업데이트 할 것이다. 나는 이것이 정확하게 코딩 질문이 아니라는 것을 안다. 그러나 이런 유형의 작업은 집중적으로 코딩하고 있으며, 누군가가 같은 작업을 수행하기를 원한다면 여기에서 그들의 길을 찾을 수있다. 나는 stackoverflow의 정신으로 통합 및 객체 등과 관련된 의견으로 업데이트하려고 노력할 것입니다.

코딩과 관련하여이 소프트웨어에 대해 더 궁금한 점이 있으면 여기에서 질문하거나 새로운 질문을 올릴 수 있습니다. 우리/당신의 프로그램에 통합하는 관점에서 (C#에서) 우리가 사용했던 코드 (메서드, 클래스 객체 등)를 게시하게되어 기쁩니다.