로컬 폴더 중 하나에있는 html 파일 인 "웹 사이트"를 다듬어야하는이 프로젝트에서 작업합니다. 어쨌든, 나는 각 학생 객체에 대한 앵커 태그의 href 값 (URL)으로 긁어 내려고 노력했습니다. 나는 또한 다른 일을 위해 긁어 모으고 있으므로 나머지는 무시하십시오. 여기에 지금까지 무엇을 가지고 : 여기Ruby에서 앵커의 href 값을 긁음
def self.scrape_index_page(index_url) #responsible for scraping the index page that lists all of the students
#return an array of hashes in which each hash represents one student.
html = index_url
doc = Nokogiri::HTML(open(html))
# doc.css(".student-name").first.text
# doc.css(".student-location").first.text
#student_card = doc.css(".student-card").first
#student_card.css("a").text
end
학생 프로파일 중 하나입니다. 그것들은 모두 같기 때문에 href url 값을 고칩니다.
<div class="student-card" id="eric-chu-card">
<a href="students/eric-chu.html">
<div class="view-profile-div">
<h3 class="view-profile-text">View Profile</h3>
</div>
<div class="card-text-container">
<h4 class="student-name">Eric Chu</h4>
<p class="student-location">Glenelg, MD</p>
</div>
</a>
</div>
감사합니다.
무엇이 질문입니까? –
'url' 또는 html 문서 샘플을 공유하십시오. – Abdullah
학생 카드 클래스 컨테이너의 href 값을 가져 오려고합니다. – alexnewby