는 한 페이지에서 몇 가지 태그를 촉각 근 위해 기계화를 사용하는 것을 시도하고있다. 저는 전에 Nokogiri를 사용하여 성공적으로 긁어 모았습니다. 그러나 이제는 더 넓은 Mechanize 클래스로 결합하려고합니다. 여기에 노코 기리 문입니다 :Nokogiri 구문을 화면 스크래핑을 위해 기계화로 변환하려면 어떻게해야합니까?
page = Nokogiri::HTML(open(@model.url, "User-Agent" => request.env['HTTP_USER_AGENT']))
@model.icons = page.css("link[rel='apple-touch-icon']").to_s
그리고 여기가 기계화 해당하는 것이라고 생각 것입니다 그러나 그것은 작동하지 않습니다 :
agent = Mechanize.new
page = agent.get(@model.url, "User-Agent" => request.env['HTTP_USER_AGENT'])
@model.icons = page.search("link[rel='apple-touch-icon']").to_s
첫 번째는 예상 <link rel="apple-touch-icon" etc etc..></link>
로 링크 태그를 반환합니다. 두 번째 문은 빈 문자열을 반환합니다. 내가 to_s
을 끝내면 나는 아주 긴 출력을 얻는다. 나는 그것이 오류 또는 실제 Mechanize 객체라고 가정합니다. 이 문제를 다시 어려운 샘플 HTML없이 https://gist.github.com/eadam/5583541
는 "작동하지 않는"정의합니다. 'search' 메소드의 반환 값은 무엇입니까? 당신은 무엇을 얻을 것으로 예상합니까? 페이지를 가리키거나 적절한 스 니펫을 포함하면 도움이 될 것입니다. –
전체 문장으로 질문을 업데이트하고 작동하지 않는 정의. 감사. – Adam
"초강력 출력"을 게시 할 수 있습니까? –