2009-10-03 1 views
0

사용 노코 기리은html 태그로 둘러싸인 각 텍스트를 배열에 넣으시겠습니까?

이이 일을
doc = Nokogiri::HTML(your_html) 
doc.xpath("//text()").to_s 

, 그러나, 그것은 하나의 평면 텍스트로 모든 것을 넣습니다.

은 내가 html 태그

<b> text</b> 
<h1>text3</b> 

로 둘러싸인 각 텍스트를 가지고 배열에 넣어해야합니다. [ "text", "text3"]

권장 조치는 무엇입니까?

은 내가

doc.xpath ("*"). 텍스트

을하고 생각하지만 모든 통해 반복하는 방법을 잘 모릅니다.

+0

더 오래된 질문을하고 더 잘 설명해주세요. – khelll

+0

예, 알고 있었지만 원래의 묻는 사람으로는 인식하지 못했습니다. – KJW

답변

2
doc = Nokogiri::HTML(your_html) 
doc.xpath("//text()").to_a 
+0

와우 정말 잘 작동합니다! 심지어는
태그로 구분되는 항목도 처리합니다. – KJW