2013-05-26 3 views
1

단락이 주어지면 문장으로 나누고 싶습니다.단락을 문장으로 나누기

알래스카는 미국

에서 가장 큰 상태 :

그것은 대부분 작동
var sentences = paragraph.split('.'); 

는 그러나이 같은 문장을 주어 때 실패 시작 : 지금이 순간 난 그저이 일을 해요

U.S.에는 마침표가 있기 때문에 문장을 S으로 구문 분석합니다.

단락의 문장을 결정하는 가장 좋은 방법은 무엇입니까? 의사당 편지 전에 마지막 기간을 기준으로 파싱을 생각했지만 그 문단이 잘 입력되지 않았다면 (소문자로 마침표를 붙이면) 실패 할 것입니다.

+1

내가 잘못했거나 문장 검색 이론보다 JavaScript에 덜 관심이 있습니까? 그럼 아마 http://programmers.stackexchange.com/에 대한 질문입니다. –

+0

아, 정규식 문제에 오신 것을 환영합니다. 왜 그렇게 말하지 않았습니까?'split ('. \ s +')'? (비록 내가 두 번째 dystroy의 제안, 정규식 구문 분석 언어/문법 어색)입니다. –

+1

문장이 점 이외의 것으로 끝날 수 있다는 것을 잊지 마십시오! –

답변

0

먼저 문단을 공백에 쪼개서 단어. 그런 다음 문장을 재구성하여 마침표, 물음표 및 느낌표로 끝나는 단어를 찾습니다. 한 마침표로 끝나면 마침표에 마침표가 하나 이상 있는지 확인하십시오. 마침표가 있으면 마침표가 아니라 약어입니다.

+1

아직 완벽하지는 않지만 드와이트 D. 아이젠 하워와 관련된 모든 문장은 유효하지 않습니다. – nyson