데이터 세트가 있고이를 Named Entity Recognition에 태그를 지정하려고합니다. 내 데이터 세트는 페르시아어입니다. 다음과 같은 표현을 어떻게 태그해야하는지 알고 싶습니다. *** آقای مهدی کاظمی = Mr Mehdi Kazemi/Mr will Smith. >>> (제목이있는 이름) 나는 모든 사람을 사람으로 태그해야합니까, 아니면
위키 피 디아에서 추출한 명명 된 엔티티 사전이 있습니다. 나는 그것을 NER의 사전으로 사용하고 싶다. 스탠포드 - NER를이 데이터로 어떻게 사용할 수 있는지 알고 싶었습니다. 어떻게 Lingpipe를 사용할 수 있을지 모르지만 Lingpipe도 다운로드했습니다. 나는 모든 종류의 정보에 감사 할 것입니다. 도움 주셔서 감사합니다.
개인이 작성한 텍스트에서 개인 속성을 추출하고 싶습니다. 예 : 저는 항상 전문 사이클링에 관심이있었습니다. 미혼모가되어 스포츠를 전문적으로 추구 할 충분한 시간을 찾는 것이 결코 쉬운 일이 아니 었습니다. 관심, 여성 : 성, 스포츠 : 내가 할 수있는 최선은 내가 자전거 타기 같은 추출 할 것, 이상적으로 ... 멜버른의 아름다운 해변을 따라 짧은 놀이
시간, 장소 및 이름이 포함 된 웹 페이지에서 엔티티를 구문 분석하려고합니다. 나는 자연어 처리와 엔티티 추출에 대해 조금 읽었지 만 잘못된 경로로 향하고 있는지 확신 할 수 없어 여기에서 묻습니다. 아직 어떤 것도 구현하지 않았기 때문에 특정 오픈 소스 라이브러리가 특정 언어에만 적합하면 괜찮습니다. (- 이벤트의 이름 - 아레나 이름 예를 들어, 201
저는 Vowpal Wabbit의 Python API를 사용하여 명명 된 엔티티 인식 분류자를 훈련시켜 짧은 이름의 사람, 조직 및 위치를 탐지합니다. 데이터에 대한 세부 정보, 모델 교육 방법 및 평가 문장에서 식별 된 엔터티를 사용하여 IPython Notebook을 작성했습니다. 교육 데이터는 ATIS 및 CONLL 2003 데이터 세트에서 제공됩니다.
최근 스탠포드 코어 NLP를 사용하여 n-gram 엔터티를 교육하려고했습니다. 나는 다음의 튜토리얼을 따라 갔다. - http://nlp.stanford.edu/software/crf-faq.shtml#b 이것으로 나는 unigram 토큰과 그것이 속한 클래스 만 지정할 수있다. 아무도 나를 안내 할 수 없으므로 그것을 n-gram으로 확장 할 수 있습니다
2 백만 이상의 이름, 단계, 위치 등의 데이터베이스/사전이 있습니다. 샘플 데이터는 다음과 같습니다. “A person who never made a mistake never tried anything new”
“Nelson Mandela”
“United States of America”
“I didn't attend the funeral, b
R에서 엔티티 추출 작업 중 UniqueID 및 Text 필드가 있습니다. 텍스트 필드에서 위치 정보를 추출해야합니다. 내 텍스트 필드는 위치 이름 설명이 text <- c("SERANGOON JC","Blk 4","SHELL TAMPINES AVE 4","SENOKO INDUSTRIAL ESTATE","Senoko Estate","Senoko","seno
의학 텍스트 용 반자동 주석 도구를 개발 중이며 주석을위한 RDF 삼중 항을 찾는 데 완전히 빠져 있습니다. 현재 NLP 기반 접근 방식을 사용하려고합니다. 나는 Stanford NER와 OpenNLP를 이미 살펴 봤으며 두 가지 모두 질병 이름 추출 모델을 가지고 있지 않다. 내 질문 : * 질병 이름 추출을위한 새로운 NER 모델을 만들려면 어떻게해야합