2012-12-03 3 views
1

TagSoup를 사용하여 HTML을 XHTML로 변환 할 수 있다는 인상하에있었습니다. tagsoup jar 파일을 tagsoup.jar로 저장했습니다. 다음 명령을 사용했습니다. wget -O usa_stock.html "http://markets.usatoday.com/custom/usatoday-com/new/html-mktscreener.asp#" | java -jar tagsoup.jar usa_stock.html이 명령을 사용하면 html과 xhtml 파일이 생성되지만 firefox에서 xhtml을 열면 파일이 비어 있습니다. 내가 파이프 라인을 만들 때 어떤 파일을 변환하려고하는지 알 수 없다고 생각합니다.bash에서 TagSoup를 사용하여 HTML을 XHTML로 변환

누군가 나를 도와 줄 수 있습니까?

감사합니다.

+1

당신은'java -jar tagsoup.jar usa_stockx.xhtml'가 기존 파일과 호환되는지 확인 했습니까? – xiaoyi

+0

부 편집을했습니다. xhtml 인코딩을 사용하여 .xhtml을 만듭니다. 그러나, 나는 그것이 전달 된 전체 HTML에 대해 항상 생성되지는 않는 것으로 나타났습니다. 그것은 빈 또는 반을 xhtml로 만들 수 있습니다. – user1709294

답변

3

코드에서 사용 된 파이프 라인 (|)은 분명히 잘못되었습니다. &&으로 변경하면 문제를 해결할 수 있습니다. wget으로

  1. stdout로 검색 웹 페이지를 출력하지 않았다, 그래서 당신은 tagsoup에 아무것도 파이프 없습니다.
  2. jsoup에 대한 입력 파일과 출력 파일도 지정했지만 파이프 라인을 사용했습니다. 따라서 java-jar이 실행되기 시작하면 wget이 실행 중입니다. tagsoup에 지정한 입력 파일이 아직 준비되지 않았습니다.

그래서 당신은 wget 먼저 && 여기에이 목적을 제공합니다 시작 jsoup 전에 0 종료 상태로 종료해야합니다.