Ruby를 사용하여 .docx 파일을 열고 읽으려고하고 텍스트와 개체/이미지의 일부를 추출하여 다른 .docx 파일에 저장하려고합니다. 내가 대신 할 경우Ruby : docx 파일의 이미지와 개체를 구문 분석/추출합니다.
zip = Zip::File.open file_path
doc = zip.find_entry("word/document.xml")
xml = Nokogiri::XML.parse(doc.get_input_stream)
wt = xml.root.xpath("//w:t", {"w" =>
"http://schemas.openxmlformats.org/wordprocessingml/2006/main"})
: 노코 기리를 사용
, 내가 제대로 내가 통해 원하는 부분으로 문서의 내 분할 텍스트를 추출 할 수 있어요
이xml.root.xpath("//w:body", {"w" => "http://schemas.openxmlformats.org/wordprocessingml/2006/main"})
내가 볼 수있는 같은 XML의 개체 : 뭔가 그 변환하는 방법
<w:object w:dxaOrig="1440" w:dyaOrig="400">
<v:shapetype id="_x0000_t75" coordsize="21600,21600" o:spt="75" o:preferrelative="t" path="[email protected]@[email protected]@[email protected]@[email protected]@5xe" filled="f" stroked="f">
<v:stroke joinstyle="miter"/>
<v:formulas>
<v:f eqn="if lineDrawn pixelLineWidth 0"/>
<v:f eqn="sum @0 1 0"/>
<v:f eqn="sum 0 0 @1"/>
<v:f eqn="prod @2 1 2"/>
<v:f eqn="prod @3 21600 pixelWidth"/>
<v:f eqn="prod @3 21600 pixelHeight"/>
<v:f eqn="sum @0 0 1"/>
<v:f eqn="prod @6 1 2"/>
<v:f eqn="prod @7 21600 pixelWidth"/>
<v:f eqn="sum @8 21600 0"/>
<v:f eqn="prod @7 21600 pixelHeight"/>
<v:f eqn="sum @10 21600 0"/>
</v:formulas>
<v:path o:extrusionok="f" gradientshapeok="t" o:connecttype="rect"/>
<o:lock v:ext="edit" aspectratio="t"/>
</v:shapetype>
<v:shape id="_x0000_i1025" type="#_x0000_t75" style="width:1in;height:20.4pt" o:ole="">
<v:imagedata r:id="rId4" o:title=""/>
</v:shape>
<o:OLEObject Type="Embed" ProgID="Equation.DSMT4" ShapeID="_x0000_i1025" DrawAspect="Content" ObjectID="_1563800156" r:id="rId5"/>
</w:object>
하지만 확인하십시오 나중에 html로 표시하는 데 사용할 수 있습니다. svg로 변환하면 html로 텍스트와 함께 표시 될 수 있습니다.
도움 주셔서 감사합니다.