웹에서 일부 텍스트를 마이닝하는 응용 프로그램을 만들려고하고 있지만 텍스트 마이닝을 수행하는 가장 좋은 방법이 무엇인지 잘 모릅니다.텍스트 마이닝의 기본 알고리즘은 무엇입니까?
이 질문에서 내가 원하는 것은 텍스트 마이닝을 수행하고 색인 생성이 아닌 문서에서 정보 검색을 수행하는 데 가장 많이 사용되는 기술/알고리즘이 무엇인지 알고있는 것입니다.
웹에서 일부 텍스트를 마이닝하는 응용 프로그램을 만들려고하고 있지만 텍스트 마이닝을 수행하는 가장 좋은 방법이 무엇인지 잘 모릅니다.텍스트 마이닝의 기본 알고리즘은 무엇입니까?
이 질문에서 내가 원하는 것은 텍스트 마이닝을 수행하고 색인 생성이 아닌 문서에서 정보 검색을 수행하는 데 가장 많이 사용되는 기술/알고리즘이 무엇인지 알고있는 것입니다.
text mining에 대해 가장 많이 사용되는 기술은 cluster analysis입니다.
대부분의 기본 텍스트 마이닝 기술은 Regular expressions입니다.