나는 사용자 쿼리와 텍스트를 취할 수있는 Java/Scala 라이브러리를 찾고 있는데, 일치하는 것이 있는지 없는지를 반환합니다. 트위터 스트림, 일괄 처리 프로세스를 사용할 여유가없는 정보 스트림을 처리 중이므로 Lucene RAMDisk를 통해 색인을 생성하고 나중에 쿼리하는 대신 실시간으로 각 트윗을 평가해야합니다. ANTLR을 사용하여 파서/렉서를
회사 이름, 주소 및 담당자 이름이 포함 된 SQL Server 테이블이 있습니다. 우리는 정기적으로 외부에서이 표와 일치해야하는 데이터 파일을받습니다. 불행히도 데이터는 완전히 다른 시스템에서 발생하기 때문에 약간 다릅니다. 예를 들어, 우리는 "123 E. Main St." 우리는 "123 East Main Street"을 받는다. 또 다른 예를 들면
필자는 두 개의 유사한 페이지로 된 좌표와 직사각형 경계와 함께 일련의 문자열을 가지고 있습니다. 이 문자열은 세 가지 방법으로 다릅니다. (i) 문자열을 페이지의 새 위치로 이동할 수 있습니다. (ii) 문자열은 동일한 위치에 있지만 수정되었습니다. (abc -> abd 또는 ABC) (iii) (i)과 (ii)의 조합. (iv) 문자열이 누락되었을 수
전체 문자열로 표시된 텍스트 파일 (또는 XML 파일)을 특정 문자열을 검색 (또는 일치)하려면 어떻게합니까? 내가 BufferedReader의 객체를 생성 한 : 스캐너 클래스를 사용 //Scanner scantext = new Scanner(input);
//Scanner scantext = new Scanner(input).useDelimiter("
내 MySQL 데이터베이스의 이름 집합과 CSV 파일의 문자열 집합 사이에 매우 간단한 텍스트 일치를 수행합니다. 실제로 비교하기 전에 문자열 정규화 옵션 배열로 preg_replace를 실행합니다. 중요한 대체품 중 하나는 불규칙한 약어를 규칙적인 전체 단어로 바꾸는 것입니다. 그러나 나는 "Inc."와 같은 약어를 붙잡을 수는 없다. 및 "Inc", "