2017-09-18 4 views
0

Ruby를 사용하여 .docx 파일을 열고 읽으려고하고 텍스트와 개체/이미지의 일부를 추출하여 다른 .docx 파일에 저장하려고합니다. 내가 대신 할 경우Ruby : docx 파일의 이미지와 개체를 구문 분석/추출합니다.

zip = Zip::File.open file_path 
doc = zip.find_entry("word/document.xml") 
xml = Nokogiri::XML.parse(doc.get_input_stream) 
wt = xml.root.xpath("//w:t", {"w" => 
"http://schemas.openxmlformats.org/wordprocessingml/2006/main"}) 

: 노코 기리를 사용

, 내가 제대로 내가 통해 원하는 부분으로 문서의 내 분할 텍스트를 추출 할 수 있어요

xml.root.xpath("//w:body", {"w" => "http://schemas.openxmlformats.org/wordprocessingml/2006/main"}) 

내가 볼 수있는 같은 XML의 개체 : 뭔가 그 변환하는 방법

<w:object w:dxaOrig="1440" w:dyaOrig="400"> 
    <v:shapetype id="_x0000_t75" coordsize="21600,21600" o:spt="75" o:preferrelative="t" path="[email protected]@[email protected]@[email protected]@[email protected]@5xe" filled="f" stroked="f"> 
     <v:stroke joinstyle="miter"/> 
     <v:formulas> 
     <v:f eqn="if lineDrawn pixelLineWidth 0"/> 
     <v:f eqn="sum @0 1 0"/> 
     <v:f eqn="sum 0 0 @1"/> 
     <v:f eqn="prod @2 1 2"/> 
     <v:f eqn="prod @3 21600 pixelWidth"/> 
     <v:f eqn="prod @3 21600 pixelHeight"/> 
     <v:f eqn="sum @0 0 1"/> 
     <v:f eqn="prod @6 1 2"/> 
     <v:f eqn="prod @7 21600 pixelWidth"/> 
     <v:f eqn="sum @8 21600 0"/> 
     <v:f eqn="prod @7 21600 pixelHeight"/> 
     <v:f eqn="sum @10 21600 0"/> 
     </v:formulas> 
     <v:path o:extrusionok="f" gradientshapeok="t" o:connecttype="rect"/> 
     <o:lock v:ext="edit" aspectratio="t"/> 
    </v:shapetype> 
    <v:shape id="_x0000_i1025" type="#_x0000_t75" style="width:1in;height:20.4pt" o:ole=""> 
     <v:imagedata r:id="rId4" o:title=""/> 
    </v:shape> 
    <o:OLEObject Type="Embed" ProgID="Equation.DSMT4" ShapeID="_x0000_i1025" DrawAspect="Content" ObjectID="_1563800156" r:id="rId5"/> 
    </w:object> 

하지만 확인하십시오 나중에 html로 표시하는 데 사용할 수 있습니다. svg로 변환하면 html로 텍스트와 함께 표시 될 수 있습니다.

도움 주셔서 감사합니다.

답변

0

그것은 즉, MSDN에 Using the Formulas Element에서의 예에 대해 그것을 비교, VML 수 있습니다 다음과 같습니다 모든이 무엇인지를 찾기 위해 VML specification에 해당 페이지의 링크가

<v:shape style='width:1in;height:1in;' strokecolor="red" 
strokeweight="2pt" coordsize="21600,21600" adj="17520" 
path="m10800,0qx0,10800,10800,21600,21600,10800,10800,0xe 
m7340,6445qx6215,7570,7340,8695,8465,7570,7340,6445xnfe 
m14260,6445qx13135,7570,14260,8695,15385,7570,14260,6445xnfe 
[email protected]@3,[email protected],[email protected]"> 
    <v:formulas> 
    <v:f eqn="sum 33030 0 #0"/> 
    <v:f eqn="prod #0 4 3"/> 
    <v:f eqn="prod @0 1 3"/> 
    <v:f eqn="sum @1 0 @2"/> 
    </v:formulas> 
</v:shape> 

입니다, 그러나 미리 작성된 도구에 관해서는별로 찾지 못합니다. 몇 가지 질문이 있지만, 대부분은 중복 된 것으로 나타나거나 다른 방법으로 모두를 참조하는 것처럼 보입니다. 질문은 Are there any tools to convert legacy VML to SVG?입니다.