문서 클러스터링을 수행하려고합니다. 입력 형식은 String 및 Number 유형의 다양한 키와 값을 갖는 JSON String입니다. 현재 키의 유형과 값에 따라 유형과 같은 유형으로 문서를 클러스터링 할 수 있어야합니다.기계 학습을 사용한 JSON 문서 클러스터링
예 : JSON 문서 : 일치하는 매개 변수를 기반으로 {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Jeans"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Shirt"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Jeans"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Jeans"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Top"}, {"title":0, "Bname":"Brand1", "weight":"100", "type":"Top"}, {"title":0, "Bname":"Lee", "height":"2864", "type":"refrigerator"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Top"}, {"title":0, "Time":"Casio", "Price":"2000", "type":"watch"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Top"}, {"title":0, "brand":"Levis", "length":"28,30,32,34,36", "type":"Shirt"}
, 내가 문서를 클러스터링 할 수 있습니다.
나는 이것을 수행하기 위해 접근법과 가능한 자바 기계 학습 라이브러리를 알고 싶다.
지금까지 클러스터링에서 Kmeans, DBSCAN을 이해했습니다.하지만이 결과에 대해 JSON 문자열을 줄이고 클러스터링을 수행하는 방법을 잘 모르겠습니다.