Lucene에서 엔티티 추출 (더 많은 일치와 같음)을 시도합니다. 다음은 샘플 워크 플로입니다. 일부 텍스트 (URL에서)와 사람 이름을 나열하면 텍스트에서 사람의 이름을 추출해보십시오. 참고 : 사람들의 이름은 완전히 정상화되지 않습니다. 예 : X 씨, Mrs. X, Mrs. Y 및 일부는 John Doe, X 및 Y입니다. 에 대해 생각할 수있는 다
위키 피 디아의 분류 정보를 사용하여 내 콘텐츠에서 태그/키워드를 추출하는 방법을 모색 중입니다. DBPedia에 대한 기사를 찾았습니다. DBpedia는 Wikipedia에서 구조화 된 정보를 추출하고 웹에서이 정보를 사용할 수 있도록하기위한 커뮤니티 노력입니다. 누구나 웹 서비스를 사용 했습니까? 그들이 어떻게 작동하고 얼마나 신뢰할 수 있는지 알고 있