2011-09-29 5 views
0

정규식을 사용하여 구문 분석해야하는 문자열이 있습니다.내 문자열에는 공백으로 인식 할 수없는 문자가 있습니다. (Regex)

http://carto1.wallonie.be/documents/terrils/fiche_terril.idc?TERRIL_id=1 Crachet 7/12

내가 뭘하려고하는 URL과 의견을 분리하는 것입니다, 그래서 시도 : 이 문자열은

(\ S +) \ S (. +) 는하지만 결과적으로 내가 얻을 :

$ 1 =>http://carto1.wallonie.be/documents/terrils/fiche_terril.idc?TERRIL_id=1 Crachet

$ 2 =>7/12

그래서, 첫 번째 문자가 공백이 아닌 것처럼 보일!

나는 'X'로 \의를 대체하기 위해 노력하고

http://carto1.wallonie.be/documents/terrils/fiche_terril.idc?TERRIL_id=1

있어 CrachetX7/12

내가 이상한 무언가를 가지고 확신합니다.

나는 (등 \ n \의 t,) 'X'로 모든 문자를 대체하는 시도했지만이 "공간 닮은"

손쉽게 찾을 수 없습니다 어떻게이 문자를 식별 할 수 있습니다 내 문자열을 분할?

편집 :

당신이 내 코드를 재생하려면, 이것은 야후입니다 파이프 : http://pipes.yahoo.com/pipes/pipe.edit?_id=a732be6cf2b7cb92cec5f9ee6ebca756

Pipes documentation에 따르면 상당히 표준 정규식 구문을 사용하는 것처럼 보입니다.

일부 테스트 :

enter image description here

enter image description here

+0

어떤 언어입니까? 태그를 달아주세요. 예를 들어 정규식은 perl에서 완벽하게 작동합니다. –

+0

그게 야후! 파이프 (내 질문에 추가) –

+0

귀하의 파이프 예제 ... 잘 작동합니다. –

답변

1

으로 정규식

^(\S+)\s+(.*)$ 

시도 10 및 m 수정 자 확인란이 선택되었습니다.

+0

g는 검사하지 않아야하고, 두 번째 부분에서 여러 단어가있을 때 오류가 발생했습니다. ;-) –