2016-06-12 3 views
0

Google은 CS 학생이며 GP에 대한 추천 시스템을 개발 중입니다. 데이터 세트에는 사용자와 방문한 장소가 포함되어 있으므로 NLP를 사용하여 해당 장소를 활동으로 변환하려고합니다. 예. (몰 -> 쇼핑, 클럽 -> 놀기 ...) 등등. 또한 사용자가 의견을 적어두면 어떤 활동을하고 있는지 알 수 있습니다.NLP를 사용하여 체크인 및 의견에서 정보 추출

우리는이 시점에서 다소 분실되어 어디서부터 시작해야하는지 또는 무엇부터 검색해야하는지 알고 싶습니다.

감사합니다.

이러한 유형의 대부분의 문제와 마찬가지로

답변

1

, 두 가지 경로가 있습니다 :

글 :

각 위치와 관련된 작업을 정의 손을 아직 이상 확장 접근 최저 초기 비용이 될 것이다 데이터 집합을 사전에 저장하십시오. 고유 한 위치의 수가 적 으면 거의 모든 노력을 기울여 관련된 모든 작업을 수행 할 수 있습니다. Mechanical Turk과 같은 임무 취업 서비스도 사용할 수 있습니다 (품질이 낮은 연관을 필터링하기 위해 각 위치에 대해 여러 답변을 모으는 것이 좋습니다).

기계 추출 :

다른 방법은/학습 예제의 큰 설정에 따라 적절한 위치를 추출하기 위해 몇 가지 NLP 알고리즘을 사용하는 것입니다. satsifactory 데이터 셋이 존재하지 않는다면, 당신은 자신 만의 데이터 셋을 만들어야 할 것입니다. (이것은 많은 노력이 첫 번째 접근입니다). 일단 당신이 코퍼스를 가지고 있다면, 시맨틱 역할 레이블링을해야 할 것입니다. 좋은 소개는 here입니다.