내가 뭘 원하는 단순히 지금까지 내가Jsoup 유튜브 제목을 검색
title = doc.getElementById("eow-title").text();
을 수행하여 Jsoup에 이것을 달성하지만 지금은 유튜브가 레이아웃의 변경 것을하는 유튜브 페이지의 제목을 검색입니다 태그가 더 이상 존재하지 않는다면, 나는 you tubehtml
코드를 검사하여 youtube player 내부에 <script>
태그라는 제목이 붙어 있다는 것을 알았습니다. 문제는 다음과 같은 형식으로되어 있습니다.
var ytplayer = ytplayer || {}; ytplayer.config = { "메시지": { "player_fallback": [ "웹 사이트의 콘텐츠를 새로 고치려면 Adobe Flash Player가 필요합니다. HTML5. \ u003ca href = \"https : //get.adobe .COM/flashplayer/\ "\ u003eScarica 난 울티마 versione 디 플래시 플레이어 \ u003c/A \ u003E 페이지 \ u003ca HREF = \"/ HTML5 \ "\ u003eUlteriori informazioni sull'aggiornamento 유엔 브라우저 HTML5 \의 u003c/A \ u003e "]},"args ": {"vm ":"CAIQABgE ","iv_invideo_url ":"https://www.youtube.com/annotations_invideo?cap_hist=1\u0026video_id=wckFsik_vU8\u0026client=1\u0026ei= JY-2WfHPFIWxcpzcrKAF ","watch_xlb ":"https://s.ytimg.com/yts/xlbbin/watch-strings-it_IT-vflA6zD4C.xlb ","pltype ":"contentugc ","author ":"BrawlBRSTMs3 X ", "제목 ":"Big Blue - F-Zero Music확장"는"innertube_api_version ":"V1 ","이벤트 ID ":"JY-2WfHPFIWxcpzcrKAF "
은 어쩌면 내가 수동으로 일부 regex
와 제목을 구문 분석 할 수 있을까? 내가 뭔가를 밖으로 작동 regex
대해 충분히 모르겠지만, 제발 도와주세요.
P. 나는 벌써 doc.getTitle();
을 쓸모 없게 시도했다. 나는 전체 제목 대신에 "유튜브"를 얻는다. pleft이 해결
doc = Jsoup.connect(getLink()).get();
Elements script = doc.select("script"); //to get the script content
Pattern p = Pattern.compile("\"title\":\"(.+?)\""); // Regex for the getting the string: "title":"blah blah blah"
Matcher m = p.matcher(script.html());
m.find();
title = m.group().substring(8);
FYI :'doc.getTitle();'은