구현중인 두 가지 기능에 대한 새로운 아이디어를 찾고 있습니다.분할 및 배열
1) 텍스트 분할 기능 : 배열의
Ex:
User Query: Resolved Query:
----------- ---------------
It has lotsofwordstogether It has lots of words together
I am using normal recursion or DP solution using unigrams probability.
2) 종류 :
Ex:
User Query: Resolved Query:
---------- ---------------
I like t shirts in Wal mart I like t-shirts in Walmart
이에 어떻게 단서. 필자가 생각한 아이디어는 현재 문장을 토큰 화하고 의미가없는 토큰을 이전 토큰 또는 다음 토큰과 결합하여 유니 그램과 대조 할 수있는 단어를 만듭니다.
이러한 솔루션은 제 요구 사항 (특히 첫 번째 요구 사항)이 느립니다. 이러한 기능을 함께 사용하고 싶습니다. 더 나은 아이디어를 찾고 있습니다.
이 필드를 처음 접했습니다. 이 책에 대한 책이나 온라인 자료를 가르쳐 주시겠습니까? T 셔츠는 문자 n 그램을 사용하여 어떻게 해결할 수 있습니까? – starkk92