2016-12-08 4 views
1
에서 제안

내 문서는 종종 같은 문장을 포함한다 : 추출 권장/텍스트

나는 이것에 대해 알았 더라면, 나는이 문제를 방지했을 것을

또는

요한이 있었다면 통보하면 이는 발생하지 않을 것입니다.

또는 제이슨 (언어 적, 그들은 확실하지이라고 무엇을)

나는 정보의 이러한 종류의 추출에 관심이 똑똑하면

는 문제가되지 않을 것입니다.

(요 통보) (방지)

대부분의 전부는 아니더라도, 관계 추출의 예제 및 : 그래서 요약 같은 이상적으로 추출 중 전체 문장, 또는 싶습니다 정보 추출은 상당히 표준적인 흐름을 따른다 : NER을 수행하면 관계 추출은 "in"또는 "at"등과 같은 관계를 찾는다 (예 : nltk 책의 ch7).

NLP에서 이러한 유형의 문장이 특정 범주에 속합니까? 이런 종류의 논문/튜토리얼이 있습니까?

답변

1

공개 된 주제에 대한 제안을 요청할 때 더 많은 예제를 제공하십시오. 내 말은, 당신이 단지 하나의 예를 들고 당신이 목표로 삼고있는 것이 충분한 정보를주지 못한다고 설명한다면 말입니다. 예를 들어, 특정 패턴을 따르는 문장이 있다면, 원하는 형식으로 정보를 추출하는 것이 더 쉬워집니다. 그렇지 않으면, 그것은 광범위하고 복잡한 연구 문제가됩니다!

예를 들어, 문장의 head words과 그 머리를 수정하는 다른 단어를 추출하려는 것 같습니다. 이 작업에 종속성 구문 분석을 사용할 수 있습니다. Stanford Neural Network Dependency Parser을보십시오. 의존성 분석기는 문장의 문법 구조를 분석하여 "머리"단어와 머리를 수정하는 단어 간의 관계를 설정합니다. 그래서, 나는 그것이 당신이 원하는 작업에서 당신을 도울 것이라고 믿습니다.

보다 일반적인 경우이 문제는 공개 정보 추출과 잘 일치합니다. Stanford OpenIE api를 살펴볼 수도 있습니다.

Stanford Relation Extractor api를 작업으로 간주 할 수도 있습니다. 그러나 필자는 의존성 분석을 통한 관계 추출이 문제 정의에 가장 적합하다고 믿는다. 이 paper을 읽고 아이디어를 얻고 작업에 활용할 수 있습니다.