ruby mechanize 웹 사이트 스크래핑은 항상 javascript 데이터 만 반환합니다

나는 기계 인증 보석과 협력하여 로그인 인증이있는 웹 사이트 콘텐츠를 긁어 모으고 있습니다. mechanize gem을 사용하여 성공적으로 로그인 할 수 있지만 mechanize를 사용하여 양식을 제출 한 후 서버 응답은 자바 스크립트 콘텐츠에만 해당되며 응답 페이지에서 볼 수있는 것은 자바 스크립트 콘텐츠입니다. html 데이터를 찾지 못했습니다. 무엇이 확실하지 않습니다. 잘못 했어. 제 코드가 있습니다. 제발 봐주세요.ruby mechanize 웹 사이트 스크래핑은 항상 javascript 데이터 만 반환합니다

agent = Mechanize.new { |a| 
a.follow_meta_refresh = true 
} 

agent.get("https://www.somewebsite.com/signin.html") 

form = agent.page.forms.first 
form.username = '[email protected]' 
form.password = 'password' 
page = form.submit 

puts page.body ## returns javascript content only

원래 사이트에는 얻을 수있는 대시 보드 콘텐츠가 있습니다.

아무도 도와 주실 수 있습니까? 미리 감사드립니다.

출처

2015-01-17 Ratnakar Vanapalli

찾고있는 사이트가 html 클라이언트 측을 구축하지 않았습니까? –

거대한 웹 사이트이며 기계화를 통해 보내는 URL에 많은 콘텐츠가 있습니다 –

웹 사이트가 콘텐츠 긁기에 제한이 있는지 또는 기계화 보석 또는 루비를 통해 금지되는지 여부를 알 수있는 방법을 알려주세요. –

내 문제를 해결하기 위해 capybara-webkit을 사용했습니다.

출처

2015-01-25 04:31:28

ruby ​​mechanize 웹 사이트 스크래핑은 항상 javascript 데이터 만 반환합니다

답변

관련 문제

ruby mechanize 웹 사이트 스크래핑은 항상 javascript 데이터 만 반환합니다