웹 사이트에서 데이터를 가져 오려고하면 양식을 제출하면 자동으로 최종 결과 페이지로 리디렉션되도록 설정된 로딩 페이지로 리디렉션됩니다. 문제는 크롤러가로드 페이지의 데이터 만 가져오고 실제로 필요한 최종 결과 페이지로 완전히 넘어 가지 않는다는 것입니다. 누군가 내가 그것을 어떻게 달성 할 수 있는지 말해 줄 수 있습니까? 가능하지 않다면 어떻게해야할까요? 당신은 컬을 사용하는 경우양식을 여러 리디렉션으로 제출
-2
A
답변
0
는 다음을 시도 할 수 있습니다 :
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
여전히 로딩 페이지를지나 점점하지 않는 경우, 그 수는 없습니다하는 HTTP 리디렉션.
그런 경우 대상 위치를 수동으로 구문 분석해야합니다. 많은 웹 사이트에서는로드 페이지에 메타 새로 고침 태그를 사용합니다. 다음과 유사한을 찾습니다 쉽게 정규식 또는 PHP를위한 라이브러리를 구문 분석하는 모든 DOM과 위를 구문 분석 할 수
<meta http-equiv="refresh" content="5; url=http://example.com/" />
.
또 다른 가능성은 자바 스크립트 리디렉션입니다. 소스 코드에서 window.location
을 포함하는 행을 찾으십시오.
지금까지 시도한 코드 스 니펫을 제공해야합니다. 어떻게하는지 읽어보십시오 : https://stackoverflow.com/help/mcve –