2017-10-16 22 views
0

큰 배치의 문서에서 개별적으로 키워드 및 개념을 추출하는 적절한 방법을 찾으려고합니다. DW에서는 IBM Watson- Knowledge Studio를 사용하는 것이 좋습니다. Knowledge Studio는 Discovery와 연결되어 있으므로 Discovery API Reference에서 키워드와 개념을 개별적으로 가져 오는 방법을 찾을 수 없습니다. 매크로 수준에서 개념을 쉽게 볼 수 있지만 각 파일에 대해 개별적으로 키워드와 개념이 필요합니다. 모든 파일이 Knowledge Studio에 업로드되었습니다. 또한 모든 것을 Discovery에 업로드했습니다. 개별 파일별로 정보를 추출 할 수 없었습니다. API 참조 가이드는 업로드 된 파일의 개별 레벨까지 정보를 추출하는 것을 다루지 않습니다. 지난 주에, 나는 지원 티켓을 신청했고, 응답은 추가 지원을 위해 Stackoverflow에 질문을 게시하는 것이 었습니다. 큰 파일 배치에서 각 파일에 대한 키워드 및 개념을 찾기위한 올바른 방법은 무엇입니까? 디스커버리 또는 NLU?IBM Watson- 키워드 및 개념 추출

모든 안내를 크게 듣습니다.

답변

1

나는 Natural Language Understanding 서비스를 시도해야한다고 생각합니다. 다음은 텍스트를 분석하고 개념과 키워드를 추출 할 수있는 데모입니다 https://natural-language-understanding-demo.mybluemix.net/.

나는 먼저 read the documentation을 추천하고 다른 언어로 된 키워드와 개념을 추출하는 방법을 호출하는 방법을 찾을 수있는 API Reference을 찾으십시오.

당신이해야 할 일은 파일을 반복 재생하고 내용을 읽은 다음 NLU로 보내는 것입니다.

const NaturalLanguageUnderstandingV1 = require('watson-developer-cloud/natural-language-understanding/v1.js'); 
const service = new NaturalLanguageUnderstandingV1({ 
    'username': '{username}', 
    'password': '{password}', 
    'version_date': '2017-02-27' 
}); 

const parameters = { 
    text: 'IBM is an American multinational technology company headquartered in Armonk, New York, United States, with operations in over 170 countries.', 
    features: { 
    keywords: { 
     emotion: true, 
     sentiment: true, 
     limit: 2 
    }, 
    concepts: { 
     limit: 3 
    } 
    } 
} 

service.analyze(parameters, (err, response) => { 
    if (err) 
    console.log('error:', err); 
    else 
    console.log(JSON.stringify(response, null, 2)); 
}); 
+0

내가 NLU가 선호하는 선택이 될 것입니다 동의하지 않았다 : 여기

는 Node.js를의 개념과 키워드를 추출 할 텍스트를 분석하는 방법의 예입니다. 설명서에 따르면 NLU는 파일을 허용하지 않습니다. 그냥 원시 텍스트, HTML 및 URL. 분석하려는 문서가 200 개가 넘지 않기 때문에 이는 작은 문제입니다. – RileyZ71

+0

Node.js에서 수행하려는 작업에 대한 자세한 정보와 코드 스 니펫으로 내 대답을 업데이트했습니다. –