punctuation

    0

    1답변

    정규식을 통해 단어 문자열을 단어 목록으로 분할하려고합니다. 나는 여전히 정규 표현식을 가진 초보자이다. 저는 nltk.regex_tokenize를 사용하고 있습니다. 결과는 가까운 곳에 있지만, 원하는 것은 아닙니다.이 >>> import re, codecs, nltk >>> sentence = "détesté Rochard ! m'étais à...

    0

    2답변

    PHP regexp를 간단한 방법으로 사용하면 문자열을 수정하여 쉼표와 단어 뒤에 오는 마침표 뒤에 공백을 추가 할 수 있지만 그 앞에 쉼표 나 마침표가 있고 그 뒤에 1,000.00와 같은 숫자가 오는 것은 아닙니다. String,looks like this with an amount of 1,000.00 요구는 String, looks like th

    1

    2답변

    PHP regexp를 간단한 방법으로 사용하면 단어 뒤에 나오는 마침표 다음에 마침표 뒤에 1.00과 같은 숫자가 오는 뒤에는 공백을 추가하도록 문자열을 수정할 수 있습니까? 또한 String. Looks like this. With an amount of 1.00 and references N.Y. 이 ... 물론 문자열 내에서 여러 인스턴스를 허용한

    0

    2답변

    문자열에있는 단어의 수를 찾는 코드를 작성합니다. 각 단어를 다른 문자로 구분할 수 있음을 알고 있습니다. AZ (또는 az). 내가 작성한 코드는 문장의 시작 부분에 문장 부호가없는 경우에만 잘 작동합니다. 그러나 문제는 따옴표와 같이 구두점을 사용하여 문장을 시작할 때 발생합니다 (예 : "연결 만하십시오."는 결과가 2 대신 3 단어로 표시됨). 저는

    7

    3답변

    utf-8 문자열을 "바이트 크기"세그먼트로 구문 분석하려고합니다. 예를 들어, 텍스트를 "문장"으로 나누고 싶습니다. 모든 언어로 된 문장의 끝 부분에 해당하는 포괄적 인 문자 (또는 정규식) 모음이 있습니까? 나는 라틴어 기간, 느낌표와 심문, 중국과 일본의 정류장 등을 포착 할 수있는 것을 찾고있다. 위와 같지만 쉼표와 동등한 것이 너무 좋다.

    -4

    2답변

    기타 사회 호기심 ... 천 년 전 내가 처음으로 C 및 C++ 클래스를 tokk 때 단순한 오백년 전에 처음으로 프로그래밍 클래스 (포트란 66) 등을 가지고 갈 때, 언어 전반에 걸쳐 꽤 표준적인 구두점 연습이있었습니다. 나는 Basic (떨림), PL/1, PL/AS, Rexx 심지어 파스칼에서 그들을 보았다. 좋습니다, APL2는이 토론의 일부가 아

    0

    2답변

    문자열 (앞이나 뒤에있는 문자열) 어디에서나 구두점 (! @ # $ %^& *()? < ""; :}} {] [ 나는 그것이 $string에 구두점을 기록하고 $anotherstring로 반향합니다. $string = "'Hello!'"; $anotherstring = "Hi"; ... 안녕하세요 '안녕!' 실제로 내가 맞춤법 검사기를 만들고 있는데 문

    0

    1답변

    공백과 구두점이 포함 된 문자열에 대해 작동하는 bash 완성 함수를 작성하려고합니다. 따옴표가 포함될 수도 있습니다. 파일에서이 문자열을 sed으로 추출하여 각 문자열에 완료를위한 대상 문자열이 들어있는 여러 줄의 텍스트로 표시합니다. 그러나, 내가 이것을 compgen -W에 전달하려고 시도했던 모든 방법으로, 나는 항상 개별 단어에 대해서만 완성을 얻

    1

    2답변

    Java에서 BreakIterator 구현을 사용하여 문자열에서 구두점을 제거했습니다. 스칼라에서이 코드를 다시 작성해야하기 때문에이 코드를 더 나은 라이브러리로 대체 할 수있는 좋은 기회라고 생각했습니다. 구현은 매우 순진하며 가장자리의 경우에는 실패합니다. 사용할 수있는 라이브러리가 있습니까? 편집 :이 List[String] 주어진 private va

    0

    2답변

    이 질문 (Best way to strip punctuation from a string in Python)은 개별 문자열에서 구두점을 제거하는 방법을 다룹니다. 그러나 입력 파일에서 텍스트를 읽길 원하지만 구두점을 끝내지 않고 모든 문자열을 한 번만 인쇄하십시오. , This is not is, clearly is: weird 그것은 "은"다른의 세