0

에 특수 문자를 고려해야합니다. 나는 그것이 무엇이다하는 것은 그것은 또한 데이터를 토큰 화를 동시에 공간을 기반으로 문자열이 특수를 기반으로 토큰 화정규식 문제는 내가 특수 문자를 기반으로 데이터를 토큰 화 할 수없는 동시에 공간을 기반 토큰에 데이터를 토큰 화해야하는 문자열

1-CHECK ON BLOCKS BELOW IF MARKET CORRECTION ARE LOADED: PCORP:BLOCK=ANCTRLG&V5PTCLG; AF55722 BRTBMWA-3289 (AF55722) in block ANCTRLG (Product ID: CAAZ 107 4493 R1A10) AF55736 BRTBMWA-3290 (AF55726)in block V5PTCLG (Product ID: CAAZ 107 4260 R2A08) IF MARKET CORRECTIONS ARE LOADED THEN V5 INTERFACE PROPERTY MUST BE DEFINED AS FOLLOW : MUXFIM : ACC-OFF (Accelerate Alligment is not active) WLL : ACC-ON (Accelerate Alligment is active) : EXAPC:V5ID=v5id,PROP=ACC-OFF; 

문자열을 처리 할 때 지금 내가 가지고있는 정규 표현식이와

 (\w*[-*#+=;:\/,~_ ]*\w+) 

입니다 같은 문자처럼

   : EXAPC:V5ID=v5id is tokenized to : EXAPC, :V5ID and =v5id rather want it to split as : and EXAPC:V5ID=v5id 

나는이 어떤 도움을 피하기 위해 어떤 도움을 주시면 감사하겠습니다.

+0

는 전 범위의 주위에 괄호와'\의 w'하지만를 사용하는'+' – dandavis

+0

왜 그냥 사용하지 마십시오. * 모든 일에 대해 그건 당신이 그것을 던져 원하는 문자를 일치로? 문자 클래스 내부의'\의 w' 이동 – grail

+0

'[- * # + =; : \ /, ~ _ \ w] +' – Toto

답변

1

귀하의 정규식 일치 "옵션 단어, 특수 문자의 다음 선택 목록, 다음 다른 단어". 두 단어가있는 경우 첫 단어 앞에 특수 문자를 사용할 수 없습니다. 당신이 아마 찾고있는 것은 ([-*#+=;:\/,~_ \w]+)입니다.

+0

제공된 정규식을 시도했지만 요구 사항을 충족하지 못합니다. 그에 따라 요구 사항을 업데이트했습니다. 그것을 들여다보십시오. –

+0

단순히 당신을 떠나, 공간을 제거'([- * # + =; : \ /, ~ _ \ w] +)'. – Hetzroni