2014-01-23 2 views
0

Amazon S3 버킷에서 엄청난 양의 로그를 구문 분석하려고했습니다.Amazon DataPipeline regex format

지금까지 튜토리얼 비디오에서 설명한대로 샘플 파이프를 만들고 구성했습니다. 그러나 어떤 이유로 RegEx가 파이프가 작동 된 후에 엉망이됩니다.

(\S+)\s... 

및 저장 후 분명 내가 알고 있는데 어떤 정규식 egine)

어떤 이해가되지 않습니다

(S+)s... 

되었다 :

원래 정규식이었다 DataPipe 구성 요소에 대한 정규 표현식을 작성하는 올바른 형식은 무엇입니까?

+1

과 같이 4 개의 백 슬래시를 넣어야합니다. 두 번 이스케이프해야합니까? –

+0

이것은 처음 시도한 것이 었습니다. (로그에 따르면) 정규식 엔진에는 단일 슬래시가 아닌 이중 슬래시로 전달됩니다. 그래서 여전히 유효한 정규 표현식이 아닙니다. – jdevelop

답변

1

지금까지 정규 표현식에 대한 설명이 누락되었습니다. 이스케이프 기호를 사용하려면

(\\\\S+)