2017-09-22 7 views
0

문서 클러스터링을 수행하려고합니다. 입력 형식은 String 및 Number 유형의 다양한 키와 값을 갖는 JSON String입니다. 현재 키의 유형과 값에 따라 유형과 같은 유형으로 문서를 클러스터링 할 수 있어야합니다.기계 학습을 사용한 JSON 문서 클러스터링

예 : JSON 문서 : 일치하는 매개 변수를 기반으로 {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Jeans"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Shirt"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Jeans"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Jeans"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Top"}, {"title":0, "Bname":"Brand1", "weight":"100", "type":"Top"}, {"title":0, "Bname":"Lee", "height":"2864", "type":"refrigerator"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Top"}, {"title":0, "Time":"Casio", "Price":"2000", "type":"watch"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Top"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Shirt"}

, 내가 문서를 클러스터링 할 수 있습니다.

나는 이것을 수행하기 위해 접근법과 가능한 자바 기계 학습 라이브러리를 알고 싶다.

지금까지 클러스터링에서 Kmeans, DBSCAN을 이해했습니다.하지만이 결과에 대해 JSON 문자열을 줄이고 클러스터링을 수행하는 방법을 잘 모르겠습니다.

답변

-1

필자는 모든 JSON 필드를 CSV 또는 일부 데이터 프레임 (파이썬 판다)에서 null 값에주의를 기울이거나 형식이 잘못된 데이터 프레임으로 변환하려고합니다.

Java로 작업하는 경우 여기 프로그래밍 언어로 컴퓨터를 익히는 good article이 있습니다. 같은 원칙을 적용 할 수 있습니다.

Weka은 감시 및 감독되지 않은 알고리즘을 시도하기 좋은 멋진 자바 도구입니다.

행운을 빈다.