특정 URL 집합을 크롤링해야한다는 요구 사항이 있습니다.Google 검색 어플라이언스 크롤링 관련 정보
예를 들어 사이트 abc.com이 있다고 가정 해보십시오. abc.com/test/needed -이 패턴과 일치하는 모든 URL을 "필요한"폴더 아래로 크롤링해야합니다. 그러나 abc.com/test/에있는 나머지 URL은 크롤링하지 않으려 고합니다.
RegEx를 사용하면됩니다. RegEx와 관련하여 도움을받을 수있는 사람이 있습니까? 당신이 패턴 양식의 것들과 일치하도록 주석의 말에서 진행
귀하의 질문에 다소 불분명합니다. 원하는 것은 무엇입니까? 당신은 URL의 목록을 가지고 당신은 다른 사람이 아닌 일부와 일치하고 싶습니까? 어떤 것들은 당신이 일치시키기를 원하고 어떤 것은 일치시키고 싶지 않은지, 예제를 제공합니다. –
예를 들어 말씀 드리겠습니다. 다음 URL이 있습니다. www.abc.com 2) www.abc.com/xyz 3) www.abc.com/xyz/imp 4) www.abc.com/xyz/waste 5) www. abc.com/pqr 패턴 "/ xyz"가있는 일치 uls를 찾을 정규식을 찾고 있는데, "xyz/imp"가 생략 된 경우 나머지를 건너 뛰거나 "/ xyz"를 일치시켜야합니다. – user1085906
그래서'/ xyz '형식이지만'/ xyz/imp' 형식이 아닌 것들과 일치 시키길 원합니까? –