www-mechanize

    8

    1답변

    그래서 WWW::Mechanize을 사용하여 사이트를 크롤링합니다. 내가 같은 URL을 요청하는 경우를 제외하고는, 좋은 작품 : http://www.levi.com/ 나는 리디렉션 오전 : http://us.levi.com/home/index.jsp 그리고 내 스크립트 나는이 리디렉션이 발생했습니다 것을 알 필요가 무엇의 URL I 은 (으)로 리

    2

    1답변

    그래서 WWW :: Mechanize를 사용하여 페이지 내용을 얻었습니다. 최대 크기를 설정하고 싶습니다. 또한 최대 크기가 맞으면 나는이 시점까지 올라온 내용을 얻고 싶습니다. 내가 LWP 당신이 이런 식으로 할 수 있다는 사실을 알고 : my $ua = LWP::UserAgent->new; $ua->max_size(1024); $ua->get($ur

    0

    1답변

    나는 웹 페이지의 모든 링크를 통해 반복하고 싶습니다, 그래서 예를 들어, 저를 제공 #!/usr/bin/perl use WWW::Mechanize; my $url = "http://www.google.com"; my $m = WWW::Mechanize->new(); $m->get($url); my @links = $m->find_all_li

    1

    3답변

    WWW :: Mechanize 라이브러리를 사용하여 URL 내용을 가져 와서 데이터를 mysql 테이블에 저장합니다. 페이지의 내용이 너무 큰 경우, 그것은이 오류 메시지 제공 : DBD :: mysql을을 :: 일이 실패 실행 : MySQL의 서버가 F 멀리 간 : 크롤링 \ \ perl_tests \ swc2.pl 라인 (481) . 나는이 페이지의 내

    0

    1답변

    대화 형 메뉴가있는 http://revigo.irb.hr/ 웹 사이트에서 정보를 다운로드하고 싶습니다. 나는 마지막 코드는 다음과 같다 perl -MWWW::Mechanize::Shell -e shell get http://revigo.irb.hr/ fillout ... submit script 사용하여 양식 필드를 가져 오는 한 후 다음과 같

    0

    1답변

    WWW :: Mechanize에서 사용되는 url_regex에 대한 올바른 구문이 무엇인지 잘 모르겠습니다. 내가 http로 시작하는 웹 페이지에서 모든 링크를 수집하고 있습니다 : //를하고 그들이 다음과 같은 형식의 위치 : 그래서 http://google.com/dir/ http://google.com/dir/dir2/ , http://googl

    -1

    1답변

    가능한 중복 연결을 가져올 수 없습니다 : Can't create an instance of WWW:Mechanize::Firefox I가 WWW::Mechanize::Firefox의 documenation에서 가져온 다음 코드. Failed to connect to , problem connecting to "localhost", port 4242: No

    1

    1답변

    WWW::Mechanize을 사용하는 Perl 스크립트는 WWW :: Mechanize의 POST 작업을 사용하여 회사 프록시를 통해 보안 된 (https) 웹 사이트에서 콘텐츠를 다운로드합니다. 경우에 따라이 게시 작업은 알 수없는 이유로 몇 시간 동안 실행됩니다. 저는 이것을 제어하고 싶습니다. 타임 아웃을 체크했는데 Stackoverflow의 게시물

    0

    2답변

    친구 나는 이미지 스크레이퍼로 작동하는 멋진 스크립트를 가지고 있습니다. 첫 번째 시련과 시험은 모두 잘 진행됩니다. 다음은 제가 스크립트에 대해 실행중인 urls.txt에서 사용하는 URL 목록입니다. 참고 이것은 간단한 목록 일뿐입니다. 스크립트가 좀 더 견고하고 일부 URL을 사용할 수 없거나 너무 오래 걸리는 경우 계속 실행하려면 2500 개의 UR

    5

    1답변

    서비스 제공 업체 로그인 양식에 어려움이 있습니다. 다른 사이트는 정상적으로 작동하지만 로그인 양식을 통과 할 수없는 이유가 있습니다. 의 웹 사이트 로그인은 다음과 같이이다 : 나는 다른 다른 사이트와 동일한 코드를 사용하여 로그인을 시도했지만 작동하지 않습니다 <form accept-charset="UTF-8" action="/sessions" clas