페이지에서 모든 링크를 얻을 수 HTTP, HTTPS, FTP 또는 FTPS (난이 정규식이 있다고 가정 . 그 사용해야합니다 ... 사용 casperjs 내가 시작 <code>a</code><code>href</code> 속성과 <code>img</code><code>src</code> 모두에서 링크 만 얻을 casperJS 및 phantomJS를 사용할 필요가
나는 단지a
태그에서 링크를 얻는 코드를 구현
((http|https|ftp|ftps):\/\/[^"]+)"/g)
, 그러나 나는 또한 정규식과 일치
img
태그에서 링크를 얻기 위해 그것을 개선 할 필요가
var casper = require('casper').create();
var links;
function getLinks() {
var links = document.querySelectorAll('img');
return Array.prototype.map.call(links, function (e) {
return e.getAttribute('src')
});
}
casper.start('https://marvel.com');
casper.then(function() {
links = this.evaluate(getLinks);
});
casper.run(function() {
for(var i in links) {
console.log(links[i]);
}
casper.done();
});
사용하는 거라고하지만 정규식이 좋아 보인다. 간단히 말하면,'http | https | ftp | ftps'를'https? ftps?'로 줄일 수 있습니다. – antoni