연속되는 한 단어로 된 문자를 모두 검색하고 그 사이의 공백을 삭제하고 싶습니다. 그러나 문장 부호는 존중되어야합니다. 예를 들어, 내가있는 경우 :R의 텍스트 컨텍스트 바꾸기
sampleText = "Abc defg h i j k, l mn, o p qrst."
나는 이렇게 될 내 결과를 싶습니다
processedText = "Abc defg hijk, l mn, op qrst."
는 R에서이 작업을 수행하는 가장 좋은 방법은 무엇입니까?
내가 절대적으로 지금을 계획했다면, 나는 아마 것 :
이str_extract(sampleText, pattern = \\w(?: \\w)+)
str_replace(extractedText, " ", "")
삽입 대체 텍스트를 (각 검출 문자 위치를 기억) 1 단계의 인덱스를 사용하여 끝에서 시작하여 뒤로 이동합니다.
그러나 이것은 매우 비효율적 인 것처럼 들립니다. 나는이 모든 소란이 없이는 이것을 할 수있는 방법이 있다고 추측하고있다. 맞습니까?
공백 만 제거하려는 경우 어떻게 쉼표가 제거됩니까? '(str_replace (sampleText, " \\ S) (\\ w) \\ s (? = \\ w \\ b)", "\\ 1")'([regex demo] //regex101.com/r/lC0uN7/1)) –
깔끔한 쉼표는 존중되어야합니다. 제안 된 패턴은 ""Abc defg hi j k, l mn, o p qrst "를 생성합니다." – GerasimosPanagiotakopoulos
ICU와 PCRE 엔진의 차이점이 있습니다. 'gsub ("(?