2016-06-15 2 views
1

나는 정책 번호, 주소 및 색인 번호라는 세 개의 기본 열이있는 일련의 주소 데이터를 가지고 있습니다. 일부 주소의 중간에는 내가 없애고 싶은 새로운 줄이 있습니다. 그러나 각 데이터 행을 분리하는 새로운 행을 제거하고 싶지 않습니다. 나는 textpad를 사용하고 있으며 검색을 사용하여 삭제하고 싶은 특정 줄 바꿈을 찾을 수있는 정규 표현식을 만들려고합니다.주소에서 개행을 제거하기 위해 정규 표현식 사용하기

각 색인 번호는 임의의 숫자 뒤에 "_CDB"가 붙어 있으므로 "_CDB"로 시작하지 않는 모든 줄 바꿈을 삭제하는 정규식을 만들려고했습니다. 따라서 현재 표현식은 과 같이 보이는 lookbehind을 사용하지만 "_CDB"가 앞에 붙지 않는 모든 새 줄을 찾는 것처럼 보입니다.

누군가가 내가 잘못 가고 있다고 제안하거나 주소 중간에 이러한 줄 바꿈을 제거하는 다른 방법을 제안 할 수 있다면 매우 좋을 것입니다.

감사

+1

당신이 파일의 샘플을 보여줄 수 설명 텍스트? –

답변

1

설명

당신의 아마 라인의 끝 부분에 공백이 라인에 끊었 지. $1

Regular expression visualization

라이브 데모

: 나는 간단히 단지 바꿀

(_CDB\s*[\n\r]+)|[\n\r] 

교체, 모든 리턴 문자와 일치하고 _CDB\n을 캡처 할 것

https://regex101.com/r/qT6nU8/1

샘플 교체 후

321321312, 1111 deer park road 
kenosha 
wi 
53144, 1111_CDB 
321321312, 222 deer park road 
kenosha 
wi 
53144, 222_CDB 
321321312, 333 deer park road 
kenosha 
wi 
53144, 333_CDB 
321321312, 4444 deer park road 
kenosha 
wi 
53144, 4444_CDB 

321321312, 1111 deer park roadkenoshawi53144, 1111_CDB 
321321312, 222 deer park roadkenoshawi53144, 222_CDB 
321321312, 333 deer park roadkenoshawi53144, 333_CDB 
321321312, 4444 deer park roadkenoshawi53144, 4444_CDB 

NODE      EXPLANATION 
---------------------------------------------------------------------- 
    (      group and capture to \1: 
---------------------------------------------------------------------- 
    _CDB      '_CDB' 
---------------------------------------------------------------------- 
    \s*      whitespace (\n, \r, \t, \f, and " ") (0 
          or more times (matching the most amount 
          possible)) 
---------------------------------------------------------------------- 
    [\n\r]+     any character of: '\n' (newline), '\r' 
          (carriage return) (1 or more times 
          (matching the most amount possible)) 
---------------------------------------------------------------------- 
)      end of \1 
---------------------------------------------------------------------- 
|      OR 
---------------------------------------------------------------------- 
    [\n\r]     any character of: '\n' (newline), '\r' 
          (carriage return) 
---------------------------------------------------------------------- 
+0

감사합니다. –