이 코드를 사용하여 HTML 페이지의 전자 메일 주소를 나열하고 있습니다. 이메일 후 문자열의 문자를 제거하는 방법
require 'nokogiri'
selector = "//a[starts-with(@href, \"mailto:\")]/@href"
doc = Nokogiri::HTML.parse File.read 'in.rb'
nodes = doc.xpath selector
addresses = nodes.collect {|n| n.value[7..-1]}
puts addresses
이
내가 구문 분석있어 샘플 코드입니다 :<a href="mailto:[email protected]?subject=My Business Is Dying">
하지만 난 그냥 이메일 주소보다 더납니다. 나는 내 결과이납니다 : 그것은 단지 이메일 주소 그래서
[email protected]?subject=My Business Is Dying
어떻게 물음표 후 모든 것을 내려합니까?
'in.rb'은 HTML 파일입니까? – tadman