2014-02-10 5 views
0

urlparse.urljoin에 대한 몇 가지 상황을 수정하고 싶습니다.python urljoin 디렉토리가 포함되지 않음

urljoin('http://xxxx.yyy/directory/','file.file') 

처럼이 lib 디렉토리를 사용 나에게 http://xxxx.yyy/directory/file.file을 제공하지만 난

urljoin('http://xxxx.yyy/directory','file.file') 

같은 URL의 마지막에 슬래쉬를 제공하지 않는 경우 나에게 http://xxxx.yyy/file.file를 제공하고이 자동 수집 프로그램을 작성하는 저를 distrube. 누구나이 문제를 해결할 수있는 솔루션을 제공 할 수 있습니다. 마지막으로 정규 표현식으로 슬래시를 넣으려고했지만 URL이 끝났을 때 제대로 작동하지 않습니다.

http://xxxx.yyy/zzzz/file.file 

답변

0

제대로 작동합니다. http://example.com/index.html에있는 경우 two.html 링크를 클릭하면 http://example.com/two.html이됩니다. 이것이 상대 URL이 작동하도록 정의 된 방법입니다.

urljoin에는 마지막 구성 요소가 디렉토리인지 여부를 알 수있는 방법이 없습니다. 아마도 .을 찾아 추측하려고 시도 할 수 있으며, 거기에 있어야한다고 생각하면 슬래시 만 추가하면됩니다.

+0

urljoin이 제대로 작동하고 있음을 알고 있습니다. 그래서 나는 또한 확장명으로 확인하려고했지만 확장명없이 링크 된 일부 파일. 대답 Eevee에 감사드립니다 :) – user2547494