3
나는 일반적으로 비공식적으로 기록 된 텍스트의 시체를 처리하지만,있어이 규칙에 의해 매우 표준 형식을 준수 때때로 재귀 (프로 요 냉동을 필요로 (요구르트프로 요 냉동과 같이, Smucker의 땅콩 버터 생각) 요구르트와 스무커의 땅콩 버터). 정규 표현식에와형식 문법은 너무 가변적이지만 NLP는 너무 제한적인 텍스트를 구문 분석하는 방법은 무엇입니까?
는 복잡성 빠르게 (Smucker의 등으로 프로 요, 땅콩 버터와 프로 요 냉동 요구르트에 의해 냉동 요구르트) 손에서 성장한다.
이 경우 EBNF를 작성하는 데 도움이되는 리소스를 찾는 데 문제가 있습니다. NLP 방법은 너무 복잡합니다 (내 "품사"는 실제로 일반 영어와 일치하지 않습니다). 세미 - 형식화 된 텍스트를 겨냥한 중간 접근법이 있습니까?
당신이 좋아하는 프로그래밍 언어, 예를 들어 "에"저렴하고 간단한 EBNF 만들 수
이러한 어휘집의 다른 예는 다음과 같습니다. http://scenerules.irc.gs/t.html?id=2009_MP3.nfo 및 유럽 귀족 제목 : http : //en.wikipedia .org/wiki/Royal_and_noble_ranks –
우리는 무엇이 유효하고 그렇지 않은지에 대한 더 많은 예를 볼 필요가 있다고 생각합니다. –
약간의 합리적인 템플릿 : [Manufacturer] [Flavor] [Flavor] [Food Type], [Flavor] [Food Type] (제조 | 판매) - 식품 유형과 가능하면 제조사의 어휘집 . 고안된 예 : * Nestle 및 Nabisco *가 만든 Praline이있는 Edy의 초콜릿 칩 아이스크림 (구문 분석 트리는 다음과 같습니다. http://www.asciiflow.com/#6223280195879178536) –