2017-10-11 13 views
-2

프로젝트 이름, 직면 한 도전 과제, 마감일 및 솔루션과 같은 회의 기록에서 핵심 테이크 어웨이를 추출하고 싶습니다. 이 모든 테이크 아웃을위한 템플릿이 있습니다. 그래서 회의가 끝나면 필자의 모델이 테이크 어웨이와 관련된 텍스트를 추출해야합니다. 제발 문제에 관한 몇 가지 포인터를주고 또한 파이썬을 사용하여 언어 제약이 있습니다. 감사합니다Python을 사용한 템플릿 기반 텍스트 요약

+0

죄송합니다. 문제 설명이 너무 모호하고 광범위하며 텍스트 마이닝과 같은 주제가 너무 많습니다. 질문을 다시 작성하십시오. 웹에 예제가 충분하지 않습니까? 아마도 여기에 당신의 시도에 대한 소개가 있습니다 : http://stevenloria.com/finding-important-words-in-a-document-using-tf-idf/ – Semo

+0

NER (Named-Entity Recognition)을 살펴보십시오. [Rambl] (https://aftercode.io/)이라는 제품도 있습니다. – blacksite

답변

0

순진한 방법은 모임 원고를 이미 목록이나 사전에 저장되어있는 테이크 어웨이 키워드 목록과 비교하는 것이 가장 바람직합니다. 이것은 규칙 기반 버전입니다. 그러나 기계 학습을 사용하려는 경우 문제 또는 일부 측면을 해결했을 수있는 유사한 작업에 대해 ieee, springer 또는 elsevier를 검색해야합니다.

이 정보가 도움이되기를 바랍니다.