nokogiri

    2

    1답변

    Nokogiri를 사용하여 특정 페이지가 의존하는 모든 도메인/IP 주소를 가져 오려고합니다. 이 때문에 자바 스크립트 동적으로로드 종속성으로 완벽 할 수는 없지만 나는 점점에서 최선의 노력으로 행복 해요 : 이미지 URL <의 img SRC = "..." 자바 스크립트 URL을 < 스크립트 SRC = "..." CSS 및 CSS의 URL (...) 요소

    1

    2답변

    주어진 html의 head 섹션에 선언 된 모든 스크립트를 가져 오려고합니다. 그러나 아무리 노력해도 항상 nil을 반환합니다. doc = Nokogiri::HTML(open('http://www.walmart.com.br/')) puts doc.at('body') # returns nill doc.xpath('//html/head').each #

    0

    1답변

    nokogiri를 사용하여 &을 최종 xml 파일에 저장할 수 있습니까? require 'rubygems' require 'nokogiri' file_name = "amp.xml" @doc = Nokogiri::XML('<project/>') arg = Nokogiri::XML::Node.new "arg", @doc

    1

    1답변

    와 문서의 모든 부모는 그와 같은 문서가 있습니다 <DL><a lot of tags>...<H3>Entry 1</H3><a lot of tags>...</DL> <DL><a lot of tags>...<H3>Entry 2</H3><a lot of tags>... <DL><a lot of tags>...<H3>Entry 21</H3><a lot o

    1

    1답변

    이 코드가 항상 0을 반환하는 이유는 무엇입니까? doc = Nokogiri::XML('<?xml version="1.0" encoding="UTF-8"?><root><l1><x:Menu xmlns:x="http://www.xworld.org/">OK</Menu></l1></root>') ret = doc.xpath("//Menu") ret.size()

    17

    1답변

    요소 (이 경우 div)가 페이지에 존재하면 Nokogiri (Ruby gem)로 HTML 페이지를 구문 분석하는 동안 어떻게 확인할 수 있습니까? 내 테스트 페이지에는 존재하지 않으므로 pp는 예상되는 Nokogiri 출력을 산출합니다. 그러나 if 문은 작동하지 않습니다. == true는 잘못된 방법입니다. 개선을위한 제안? true와 비교 건배, 크리

    1

    1답변

    Nokogiri로 HTML 페이지를 구문 분석하려고하지만 텍스트와 관련된 문제가 있습니다. 주로, 나는 원치 않는 문자를 제거 할 수 없습니다. 파싱하는 동안 문자열을 얻을 때마다 가능한 한 많이 정리하려고합니다. 인쇄 할 수없는 문자를 고유 한 공간으로 변환하려고합니다. def clear_string(str) CGI::unescapeHTML(st

    1

    2답변

    Ruby로 간단한 뉴스 애그리 게이터를 만들고 있습니다. 나는이 언어에 완전히 익숙하지 않으며 방금 open uri 함수를 사용하는 방법을 발견했다. 이제 내 문제는 html 페이지를 구문 분석하는 방법입니다. 루비에 파서가 내장되어 있습니까? BTW, 나는 레일을 사용하지 않는 나는 그것을 사전에 덕분에 매우 간단하고 싶다!

    1

    2답변

    몇 가지 태그가있는 RSS 문서가 있습니다. 콘텐츠를 바꾸거나 바꿀 곳이 <foo> 및 <bar> 인데요. 이 작업을 수행하는 가장 효율적인 방법은 무엇입니까? 전체 피드를 구문 분석하고 콘텐츠를 인라인으로 교체합니까? 그렇다면 위의 두 형제 노드에 대해이를 수행하려는 경우 블록이 어떻게 보이게 될까요? 문서를 순차적으로 구문 분석하고 내용을 검토 할 때

    0

    2답변

    Nokogiri XML 문서의 크기를 가져 오는 방법을 알아 내려고하고 있습니다. 이 문서는 open로 가져되고 : Nokogiri::XML(open(my_url)) 는이 시점에서 반환 된 문서의 크기를 결정 할 수 있습니까? Content-type이나 Content-Length와 같은 HTTP 헤더를 검색 할 수 있습니까?