2014-10-11 5 views
0

데이터를 업로드 할 때 openrefine에서 텍스트 패싯을 클릭 한 다음 클러스터링을 클릭하십시오. 클러스터를 생성합니다. 마찬가지로 : Aniket Ghodke와 Ghodke Aniket은 이들을 병합 할 것을 제안합니다. 그러나이 값들을 저장할 수있는 방법이 있습니다. 마치 "Aniket Ghodke"와 "Ghodke Aniket"을 병합하여 "Aniket Ghodke"라고 말하면 나는이 값들을 나의 추가 참조 용으로 저장할 수 있습니다. 파이썬이나 자바 라이브러리도 사용할 준비가되었습니다. 하지만 가능합니다.수정 텍스트 패싯 클러스터

답변

0

GREL을 통해 ngram(value,4) 또는 fingerprint(value)과 같은 클러스터링 기능의 대부분을 호출 할 수 있습니다. 결과를 새로운 컬럼 또는 패싯에 저장하여 결과를 탐색 할 수 있습니다.

This blog post 어떻게 사용하는지 설명합니다.