enter image description here 나는 단어 구름을 만들고있다. 창작시 나는 마지막 알파벳이없는 많은 단어를 보았습니다. 예를 들어, 영화 -> 영화 ->가된다왜 내 학술 문서 행렬 끝에 문자가 누락 되었습니까?
나는 노란색으로 단어를 표시했다. 마지막 한두 개의 글자가 누락되었습니다.
enter image description here 나는 단어 구름을 만들고있다. 창작시 나는 마지막 알파벳이없는 많은 단어를 보았습니다. 예를 들어, 영화 -> 영화 ->가된다왜 내 학술 문서 행렬 끝에 문자가 누락 되었습니까?
나는 노란색으로 단어를 표시했다. 마지막 한두 개의 글자가 누락되었습니다.
이 질문에 대한 답변이 필요한 사람들을 위해 - 우리는 데이터에 형태소 분석을 수행 할 때 줄기 기능이 같은 어근. 이 모든 단어들은 그 루트 단어로 설정됩니다. 이것이 우리가 "영화"를 "Movi"로 보는 이유입니다.
단어의 끝에 누락 된 문자는 사전 스테핑의 결과입니다. DTM 또는 TDM을 만들기 전에 형태소 분석을 피하고 형태소없이 단어를 만들어보십시오.
이상하게 들릴지 모르지만이 문제는 형태소 분석이 철자가 아닌 단어의 발음을 고려하고 있기 때문에 가능합니까? –