1

나는이 목록을 긁어 내고 내 고객에게 속한 사이트에서 이러한 구인 목록에 대한 더 많은 노출을 제공하려고합니다. 문제는 구직자를 지원하기 위해 특정 직업 목록에 연결할 수 있어야한다는 것입니다. This is the page 목록 링크를 저장하려고합니다.URL이없는 것으로 보이는 페이지 긁기

구직자가 클릭하여 원래 목록을보고 적용 할 수있는 주소를 저장할 수 있다면 이상적입니다.

  1. 이 페이지
  2. 의 URL 기능하지 않는 일이 웹 사이트는 내가 그 주소를 생성 할 수있는 방법을 가능하면 목록 특정 주소를
  3. 를 제공 할 수 무엇인가인가?

특정 주소를 얻을 수없는 경우 클라이언트의 사이트에서 내부 스크립트를 트리거하는 링크를 클릭하여 목록 ID를 얻은 사이트를 검색하여 해당 목록을 찾은 링크를 클릭 할 수 있다고 생각합니다. 그런 다음 사용자를 해당 특정 목록으로 리디렉션합니다.

이 단점은 목록이 디렉토리에 얼마나 멀리 있는지에 따라 사용자가 잠시 기다려야한다는 것입니다. 나는 즐거운 "당신의 명부 작성을 찾는 진행성 막대기의 어떤 종류를 둘 수 있었다! 참을성있어 주셔서 감사합니다"메시지.

그래도이 작업을 수행하지 않아도된다면 좋을 것입니다.

나는 Nokogiri와 Mechanize를 사용하고 있습니다.

+0

기계화는 양식 제출을 허용합니다. 감사! –

+0

당신이 여기에 대답으로 적어 놓은 것을 쓸 수 있다면 나는 그것을 당신에게 줄 것이다. –

답변

0

참조하는 페이지는 오라클 제품에 의해 생성 된 것으로 보입니다. 따라서 웹 양식을 올바르게 작성하고 (접근성과 관련하여) 기꺼이 생각할 것입니다. 그들은 그렇게하지 않았기 때문에 엔지니어가 나쁜 날을 보내고 있거나 의도적으로 긁어 내기가 더 힘들다고 나에게 일어난다.

해당 링크 위로 마우스를 가져 가면 브라우저에 href이 표시되지 않는 이유는없는 것입니다. 대신 페이지가 수행하는 것은 JavaScript를 사용하여 클릭 이벤트를 캡처하고 일부 숨겨진 값으로 POST 양식을 채우며 프로그래밍 방식으로 submit 메서드를 호출하는 것입니다. 이로 인해 화면 판독기 및 기타 접근성 장치에 문제가 발생할 수 있으며 뒤로 단추가 페이지를 다시 제출해야하는 방식에 문제가 발생할 수 있습니다.

좋은 소식은 일반적으로 이런 종류의 구성은 제 3 자 페이지의 실제 페이지를 사용하거나 크롤러 라이브러리를 통해 직접 양식을 만들어서 긁을 수 있다는 것입니다. 대상 URI에 올바른 값을 게시하고 페이지 스크립트를 검토하지 않고 리버스 엔지니어링하면 결과 문서가 예상되는 "링크 된"페이지 여야합니다.

+1

정말 고마워요! –