2013-09-28 4 views
0

질문을 시작하기 전에 similar question이 초기 로그인을 처리하는 데 도움이되었습니다. 내 문제는 다음과 같습니다.지난 로그인 페이지 및 그 이후의 모든 로그인

내가 미러링하려고하는 웹 사이트가 있습니다. 그것은 제가 설명 할 부분입니다. 내 도구로 wget을 사용하고 있습니다. 나는 컬을 시도했으나 포스트 데이터를 제출하는 것이 쉽지만 wget은 당면한 과제에 더 잘 부합한다는 것을 발견했다.

웹 사이트에는 리디렉션되는 초기 로그인 페이지가 있습니다. 이 후에는 웹 사이트의 모든 항목에 액세스 할 수 있습니다. 로그인은 너무 오래 지나서 시간 초과되지만 그게 전부입니다.

아래 wget 명령을 사용하여 쿠키를 성공적으로 저장하고로드하고 모든 하위 폴더를 다운로드 할 수있었습니다. 그러나 내 문제는 각 아이가 동일한 로그인 페이지의 index.html을 가지고 있다는 것입니다. 루트 폴더는 쿠키가 잘 작동하지만 그 아래에는 아무것도없는 것과 같습니다. 이후 데이터 변수/IDS가 다른

wget http://site.here.com/users/login --save-cookies cookies.txt --post-data '[email protected]&password=*****&remember_me=1' --keep-session-cookies --delete-after 
wget http://site.here.com/ --load-cookies cookies.txt --keep-session-cookies -r -np 

하는 것으로 그리고 나는 그들이 무엇인지 확인하기 위해 로그인 페이지를 다운로드했다는 것을 : 내가 사용

명령이었다.

둘째로, remember_me 값을 1로 설정하지 않으면 cookies.txt가 달라집니다. remember_me없이

= remember_me으로 1

.here.com TRUE / FALSE numbershere CAKEPHP garbagehere 

= 1

site.here.com FALSE / FALSE numbershere CakeCookie[rememberme] garbage 
.here.com TRUE / FALSE numbershere CAKEPHP garbagehere 

전은 로그인 페이지를 다운로드 것이고, 후자는 아이들과 함께, 모든 하위 폴더에가는 것을되는 결과 로그인 색인이 포함되어 있습니다.

나는 괴롭다. wget과 http에 대한 나의 경험은 매우 제한적이다. 이 일을 끝내기 위해 당신은 무엇을 할 것입니까? 각 어린이를 위해 쿠키를 생성 하시겠습니까? 각 어린이에 대한 쿠키 파일을 수동으로 생성하는 대신이를 어떻게 자동화 하시겠습니까?

P.S : 답변을 반영한다면 Linux를 사용하고 있습니다.

답변

0

알아 냈어. 거의.

위의 옵션을 사용하여 wget을하면 모든 자식을 얻습니다. 그런 다음 위의 옵션을 사용하여 각 자식을 wget하고 에 "/"로 끝나는 폴더를 지정하면 작동합니다.

왜 그런 행동인지는 모르지만 그렇습니다. 내가 이것을 할 때, 그것은 아이들, 아이들 또는 그와 같은 것을 잡는 데 문제가 없습니다.