0

텍스트에서 특정 패턴을 찾는 방법을 찾고 있습니다. 예를 들어이 같은 형식의 텍스트에서 모든 참조를 찾을하려는 경우 : 그것은 향하고 어떻게 영어의 진화 및 그 루트 리지 :문자열의 특정 패턴 찾기

  • 남작, 나오미 (2000) 알파벳 이메일로 런던과 뉴욕.

그래서 이와 비슷한 내용이 입력 텍스트에서 반환됩니다. 거기에 좋은 어떤 알고리즘이 있습니다. 지금까지 텍스트에서 유사한 문자열을 검색하는 알고리즘을 발견했습니다.

정규 표현식 사용에 대해 생각해 보았지만 유사성 지수를 계산하여 가장 좋은 점수를 얻은 결과가 나오기 때문에 정규 표현식을 사용하는 것이 가장 좋은 방법인지는 알 수 없습니다.

+0

어떤 언어입니까? 당신이 [스핑크스] (http://sphinxsearch.com/)와 같은 것을 필요로하는 것처럼 보입니다. –

+1

당신이 찾고있는 것을 묘사하십시오 - [문법] (http://en.wikipedia.org/wiki/Formal_grammar)을 기술하십시오. 더 많은 예를 들어 보겠습니다. 일단 당신이 그것을하면 - 정규식이 충분한 지, 아니면 당신이 [context-free] (http://en.wikipedia.org/wiki/Context-free_language) 파서가 필요한지 분명해질 것입니다. SLR?] (http://en.wikipedia.org/wiki/LR_parser) 어쩌면 [LL] (http://en.wikipedia.org/wiki/LR_parser)?) – amit

+0

이러한 문자열을 구문 분석하는 것은 유사점을 계산하는 두 가지 별개의 작업입니다. . –

답변