2017-10-25 12 views
-2

개인이 작성한 텍스트에서 개인 속성을 추출하고 싶습니다. 예 :텍스트에서 개인 속성 추출하기

저는 항상 전문 사이클링에 관심이있었습니다. 미혼모가되어 스포츠를 전문적으로 추구 할 충분한 시간을 찾는 것이 결코 쉬운 일이 아니 었습니다. 관심, 여성 : 성, 스포츠 : 내가 할 수있는 최선은 내가 자전거 타기 같은 추출 할 것, 이상적으로 ... 멜버른의 아름다운 해변을 따라 짧은 놀이기구에 대한

를 이동하는 것이었다 관심을, 멜버른 : 위치. 나는 이것이 명명 된 엔티티 추출이라고 생각하지만, 나는 확실하지 않다. 나는 Stanford Named Entity Recognizer을 시도하고 그것은 내가 원했던 것을 나에게 꽤주지 않았다. 가장 중요한 것은 성별, 나이, 관심사 등의 개인적인 특성이며 다른 샘플에서 대부분을 잃어 버렸습니다.

내가 할 수있는 도구/라이브러리 (파이썬이 바람직 함)가 있습니까? 나는 NLTK에 대해 알고 있지만 어떻게 활용할 수 있는지 모르겠다.

+0

이 패키지가 도움이되는지 확인하십시오 ... https://pypi.python.org/pypi/geograpy –

답변

0

일반적으로 스탠포드 명명 된 엔티티 태그 지정자에는 기본 구분 기호가 있습니다. 일반적인 분류는 'Name','Location','Organizations'과 같습니다. 다른 태그를 사용해야하는 경우에는 자체 분류자를 훈련해야합니다. this for create new classifier을 참조하십시오. 나는 커스텀 모델을 만들고 잘 작동한다.