sgml

    0

    1답변

    나는 최근에 Standard Generalized Markup Language을 발견했습니다. 나는 EMILLE/CIIL Corpus에서 SGML 형식의 자료를 수집했다. EMILLE Corpus Documentation I 파일에서 바로 텍스트 선물을 추출 할이이 신체에 대한 설명서입니다. 문서에서 코퍼스의 인코딩 및 마크 업 정보는 다음과 같습니다. 텍

    0

    1답변

    닫을 필요가있는 태그와 그렇지 않은 태그를 혼합 한 SGML 파일이 있습니다. BeautifulSoup는 HTML에 대해 이것을 가장 잘 나타낼 수 있지만 태그는 custom이고 BeautifulSoup은 파일 끝 부분에서이를 닫습니다. 여기에 소스입니다 : from bs4 import BeautifulSoup import requests url =

    0

    2답변

    이 질문은 "SGML over XML과 SGML over XML을 사용하는 장단점은 무엇입니까?"와 동일합니다. 나는 SGML과 XML의 몇 가지 유사점과 차이점을 이미 알고 있지만이 질문에는 대답하지 않습니다. 유사점 SGML 및 XML 모두 우리가 문서 (구조, 데이터, 메타 데이터)를 설명 할 수 있습니다; 둘 다 데이터/구조/메타 데이터와 모양 (색

    0

    1답변

    우리는 2gb sgml 파일 크기를 입력으로 사용하여 2.2gb 주위에있는 파일을 출력하는 omnimark 스크립트를 가지고 있습니다.이 스크립트는 유닉스 쉘 스크립트에서 호출되며 때때로 스크립트가 성공적으로 실행될 때가 있습니다. 그냥 오류없이 중단되었습니다 .... 어떤 생각이나 제안이 디버깅하는 방법?

    3

    1답변

    SGMLParser를 상속받은 간단한 클래스를 작성했습니다. 이 클래스의 기본 아이디어는 html 페이지에서 모든 링크를 수집하고이 링크가있는 행 번호를 인쇄하는 것입니다. 클래스는 다음과 같습니다 class HtmlParser(SGMLParser): def reset(self): SGMLParser.reset(self) se

    1

    2답변

    SGML은 HTML과 XML의 상위 집합입니다. 풍부한 HTML 및 XML 구문 분석기를 사용할 수 있습니다. 당신은 나에게 현재의 bussiness 도메인의 SGML (샘플 비즈니스 scneario)의 사용법을 설명해 주시겠습니까? legecy 시스템을 다룰 때입니까? HTML, XML 문서에는 HTML 및 XML 파서가 있습니다. 왜 SGML 파서? 제

    0

    1답변

    첫 번째 XML 문서를 유효하게 만드는 DTD를 찾고 있는데 가능한 경우 두 번째 DTD를 찾고 있습니다. 먼저 XML : <A> <B> <C>bla</C> <D>bla</D> <C>bla</C> <D>bla</D> <D>bla</D> </B> <B> <C>bla</

    0

    1답변

    내부 CDATA 그것을 ubderstand하지 않았다 :이 경우에 선언 된 요소는 지금의 내부에 문자 데이터를 가질 수 있도록 PCDATA는, 구문 분석 문자 데이터를 의미합니다, 당신은 수 있습니다 분석되지 않는 CDATA 섹션이있는 요소를 정의하는 방법이 있는지 궁금해합니다. 그리고 대답은 CDATA 태그 자체가 실제로 구문 분석된다는 것입니다. 그것은

    6

    1답변

    XML 파서가 요소가 비어 있거나 자동으로 닫히는 지에 대해 신경 쓰지 말아야한다는 사람들이 들리기 전에자가 폐쇄 형 XML 요소를 허용 할 수없는 이유가 있습니다. 그 이유는 내가 실제로 SGML이 XML이 아닌 SGML DTD로 작업한다는 것이 매우 엄격하고 그것을 허용하지 않기 때문입니다. 내가 가지고있는 것은 XSLT를 실행하는 데 필요한 수천 개의

    0

    1답변

    웹 사이트에서 html 대신 json 응답을 보내면 어떻게 규칙을 세울 수 있습니까? 시작 URL 첫 번째 응답에서 그것은 html 응답을 제공하지만 페이지를 탐색 할 때 json 응답을 제공합니다. 여기 내 규칙 : Rule(SgmlLinkExtractor(restrict_xpaths=('//div[@class="GridTimeline-items"]'),