Feedjira를 사용하여 뉴스 피드의 콘텐츠 분석을 돕기 위해 노력했지만 RSS 피드는 RSS로 포함시키는 것이 아니라 " Feedjira not adding content and author ". Feedjira를 사용하여 기사의 URL을 얻으 려하지만 Nokogiri를 사용하여 기사를 긁어서 관련 부분을 선택하십시오.다양한 요구 사항을 지닌 Nokogiri를 사용하여 데이터베이스에서 다른 URL을 긁는 방법
문제는 각 미디어 콘센트의 페이지마다 다른 형식이 있으므로 Nokogiri가 데이터베이스 (Feedjira에서 제공)에서 URL을 가져 오는 가장 좋은 방법을 알아야하며 관련 피드 제목에 따라 Feedjira sync의 데이터베이스)는 특정 방식으로 페이지를 긁어 데이터베이스의 별도 테이블에 저장합니다. 누구든지 제안을 받았습니까?
나는 모양을 보았지만 매우 일반적인 것처럼 보입니다. 이상적으로 필자는 저자뿐만 아니라 여러 가지 다른 속성을 긁어 모으는 방법을 찾고 있으며 가독성으로이 작업을 수행 할 수 있는지 확신 할 수 없습니까? 나는 [Mercury Parser] (https://mercury.postlight.com/web-parser/)와 [Ruby wrapper] (https://github.com/moisesnarvaez/mercury_parser)를 찾았지만 용어는 한계가있는 것처럼 보인다. . –