2015-01-17 2 views
0

귀하의 도움이 필요합니다. 나는 약간의 HTML 코드가 있습니다스크랩 이미지

<div class="item item_table clearfix js-catalog-item-enum c-b-2" id="i378171915" data-type="2"> 

<div class="b-photo"> 
     <a class="photo-wrapper" href="/moskva/kvartiry/1-k_kvartira_35_m_1046_et._378171915" title="Объявление «1-к квартира, 35 м², 10/46 эт.» (4 фотографии)"> 
    <img src="//81.img.avito.st/140x105/1327419481.jpg" class="photo-count-show" alt="1-к квартира, 35 м², 10/46 эт."> 
    <span class="photo-icons"><i class="i i-photo">4</i></span> 
    </a> 

</div> 

을 내가 스크랩 이미지

+0

당신은 당신이과에서 작업하는 어떤 언어로 지정해야보십시오이 작업에 제발 도와주세요 필요 그 데이터가 어떤 형태로 표현되고 있는가. 나는 언어가 r (이 종류의 일에 나쁜 선택이다)이라고 생각하지만 문자열 변수 또는 파일이거나 웹 어딘가에 거주하고 있어야한다. –

+1

R은 HTML 작업에 나쁜 선택이 아닙니다. 요즘에는 좋은 도구가 많이 있습니다. 그러나 나는이 질문에 더 많은 맥락이 필요하다는 데 동의한다. –

+0

안녕하세요, 마이크. 저는 R과 함께 일하고 있습니다. 저는 사이트의 정보가있는 데이터 프레임을 만들고 열의 하나에서 download image.First에 대한 링크가 필요합니다. (xpathSApply (doc, '// div [@ class = "b- 사진]]/*/@ src ') 그리고 나서 파일을 다운로드하십시오 –

답변

1

require(XML) 
html <- '<div class="item item_table clearfix js-catalog-item-enum c-b-2" id="i378171915" data-type="2"> 

<div class="b-photo"> 
     <a class="photo-wrapper" href="/moskva/kvartiry/1-k_kvartira_35_m_1046_et._378171915" title="Объявление «1-к квартира, 35 м², 10/46 эт.» (4 фотографии)"> 
    <img src="//81.img.avito.st/140x105/1327419481.jpg" class="photo-count-show" alt="1-к квартира, 35 м², 10/46 эт."> 
    <span class="photo-icons"><i class="i i-photo">4</i></span> 
    </a> 

</div>' 
doc <- htmlParse(html, asText = TRUE) 
urls <- paste0("http:", xpathSApply(doc, '//div[@class="b-photo"]//*/@src')) 
for (url in urls) 
    download.file(url, file.path(tempdir(), basename(url)), mode = "wb", quiet = TRUE) 
shell.exec(tempdir()) # open temporary directory on Windows