2016-09-08 5 views
1

IBM Watson의 문서 변환 서비스를 활용하여 다양한 유형의 문서를 응답 단위로 변환하는 프로그램을 작성 중입니다. 서비스에 의해 반환되는 각 답변 부 콘텐츠라는 배열을 포함하는 MEDIA_TYPE텍스트 소자를 갖는 오브젝트로 구성된다.왓슨 문서 변환 서비스에서 반환 한 응답 단위 콘텐츠 배열에 둘 이상의 요소가있을 수 있습니까?

나는이 내용 배열에 하나 개 이상의 요소를 본 적이 없어, 나는이 있다면 그들을 처리하는 방법을 모르겠어요. 이 배열에 하나 이상의 요소가있을 수 있습니까? 그렇다면 가능한 값은 무엇입니까? 그들은 모두 media_type 값을 가질 것입니까? 현재 내 계획은 두 개 이상의 문자가 존재하는 경우 모든 텍스트 요소를 하나로 결합하는 것입니다.

답변

2

답변 단위 콘텐츠 배열은 둘 이상의 요소를 가질 수 있습니다 (요청할 경우 - 아래 참조). 이 경우 배열의 각 요소는 동일한 내용의 다른 미디어 유형 표현이됩니다.

요청에 두 가지 이상의 출력 용지 유형을 넣으면됩니다. 이 작업을 수행하면 출력 내용 배열에 사용자가 요청한 각 미디어 유형에 대한 요소가있는 요소 이상이 포함됩니다. 귀하의 요청이 같은 config이 포함 된 경우

예를 들어, :

{ 
    conversion_target : 'answer_units', 
    answer_units : { 
     output_media_types : ['text/plain', 'text/html'] 
    } 
} 

(당신이 config을 어디다의 설명 https://www.ibm.com/watson/developercloud/document-conversion/api/v1/#convert-document 참조)

를 그런 다음 응답으로 content이 포함됩니다

content : [ 
    { 
     text : <the plain text contents of the answer unit>, 
     ... 
    }, 
    { 
     text : <the HTML contents of the answer unit>, 
     ... 
    } 
] 

당신은 항상 출력의 텍스트 버전으로, 길이 1의 배열을 얻고있는 이유

 output_media_types : ['text/plain'] 

이것은 '가 t 출력 미디어 타입 매개 변수를 지정, 당신은 기본 값을 얻을 수 있습니다. 암시 적으로 기본 구성을 그대로두면 하나의 출력 용지 유형을 묻습니다.

+0

참조하십시오. output_media_type을 지정하지 않으므로 한 요소 만 존재합니까? 문서 변환에서 허용하는 모든 파일 형식을 변환 중입니다. –

+0

죄송합니다. 옵션을 포함하지 않은 경우 기본 동작을 포함해야합니다. 지금 포함하도록 답변을 업데이트했습니다. – dalelane

+1

단지 지적하고 싶습니다. output_media_types 옵션은 현재 지원되지 않는 기능 (예 : 향후 사라질 수 있음) 때문에 문서화되지 않았습니다.또한 해당 스 니펫에 포함 된 html은 일치하지 않는 태그로 조각화 될 수 있습니다. –

1

답변 단위 변환기는 현재 제목 태그 (기본값 : <h1><h2>)로만 나뉩니다. 좀 더 세부적으로 답변 단위를 분할 할 경우, 당신은 사용자 정의 구성에 전달하여 그것을 분할하는 레벨을 변경할 수 있습니다

{ 
    "answer_units": { 
     "selector_tags": ["h1","h2","h3","h4","h5","h6"] 
    } 
} 

이 좋은 정보입니다 https://www.ibm.com/watson/developercloud/doc/document-conversion/customizing.shtml#htmlau

+0

는, 그렇지 않습니다? (OP가 물었던 출력'content' 배열보다는). 또는 나는 오해가 무엇입니까? – dalelane

+0

당신은 틀린 항목입니다. 질문을 자세히 읽지 않았습니다. –