2016-11-24 2 views
1

Nokogiri :: HTML :: DocumentFragment 문서를 정리해야합니다 (공백 만 포함하는 주석 노드와 텍스트 노드 만 제거해야합니다). 다음 예는 다음과 같습니다문서 조각에서 주석 또는 텍스트 노드 찾기

#(DocumentFragment:0x3fc65f9f5870 { 
    name = "#document-fragment", 
    children = [ 
    #(Element:0x3fc65f9f5064 { name = "p", children = [ #(Text "paragraph")] }), 
    #(Comment " comment "), 
    #(Element:0x3fc65f9f4f60 { name = "p", children = [ #(Text "paragraph")] }), 
    #(Text " "), 
    #(Element:0x3fc65f9f4e48 { name = "p", children = [ #(Text "paragraph")] }) 
    ] 
}) 

을 나는이 문서 조각의 모든 의견이나 모든 텍스트 노드를 찾을 수있는 방법 : 예상대로

html = "<p>paragraph</p><!-- comment --><p>paragraph</p> <p>paragraph</p>" 
doc = Nokogiri::HTML::DocumentFragment.parse html 

문서 조각이 보인다?

doc.search('//text()') 
doc.search('//comment()') 

답변

2

이 그것을 알아 냈 :

doc.search('.//text()') 
doc.search('.//comment()') 

하면 그것은 전체 문서 있지만 문서 조각 아니기 때문에 작동하지 않습니다 다음