2016-06-01 9 views
2

셀레늄과 함께 파이썬을 사용하여 많은 웹 페이지를 스크린 샷하고 있습니다. 참조 용으로 PNG를 로컬에 저장하려고합니다. URL 목록은 다음과 같습니다.URL을 기반으로 파일에 대한 파일 이름을 만드는 현명한 방법은 무엇입니까?

www.mysite.com/dir1/pageA 
www.mysite.com/dir1/pageB 

제 질문은 스크린 샷 PNG에 어떤 파일 이름을 부여 할 것인가에 대한 것입니다.

예를 들어 이미지 파일을 호출하면 www.mysite.com/dir1/pageA.png 무의미한 슬래시는 필연적으로 문제를 일으킬 수 있습니다.

URL의 /자를 모두 _으로 바꿀 수는 있지만 문제가 될 수도 있습니다. URL에 이미 _ 문자가있는 경우 (파일 이름에서 URL로 거꾸로 작업 할 필요는 없지만 나쁜 것은 아닙니다.)

이름을 처리하는 방법은 무엇입니까?

답변

0

'% 2F'를 사용하면 어떻게됩니까? '/'하지만 html로 인코딩되었습니다.

소스 : http://www.w3schools.com/tags/ref_urlencode.asp

+0

일반적으로 '%'는 파일 이름에 사용하기에 문제가있는 문자입니다. 자세한 내용은 http://stackoverflow.com/questions/4814040/allowed-characters-in-filename을 참조하십시오. –

1

서버의 디렉토리 구조 및 로컬 컴퓨터에 그 구조를 복제 않습니다 wget 같이하는 것입니다 거의 확실하게 무엇을 표현하는 가장 쉬운 방법.

는 따라서 / 문자는 디렉토리 구분되고, 당신의 www.mysite.com/dir1/pageA.pngdir1라는 디렉토리에 pageA.png라는 PNG 파일이 될 것이며, dir1www.mysite.com라는 디렉토리에 있습니다.

간단하고 쉽게 되돌릴 수 있으며 모호한 결과가 발생할 염려가 없습니다.