2013-05-01 2 views
0

나는 가능한 한 프로그래밍을 배우고 있으며 파이썬으로 시작했다. 나는 현재 IRC 통계 생성기를 작성 중이며 (이미 충분하지 않은 것처럼), 특정 로그 형식의 사용자 이름 (그리고 사용자 이름 만)과 일치하는 정규식을 찾으려고합니다. 그러나 내가 가지고있는 사람이 과 일치하지 않습니다. 재검색. 당신이 볼 수 있듯이, 나는 이름 때를 찾기 위해 두 개의 문을 만든정규식을 사용하여 IRC 로그에서 사용자 이름을 추출 하시겠습니까?

findusername = re.compile("^[a-zA-Z]+\s[0-9]+\s[0-9:]\s<([A-Za-z]+)>") 
finduseraction = re.compile("^[a-zA-Z]+\s[0-9]+\s[0-9:]\s\*\s+([A-Za-z]+)\s") 

: 여기

may 01 14:04:54 <FishCream> Wahoo! 
may 01 14:05:01 <LpSamuelm> Oh, if only talking was this fun in real life. 
jan 01 00:00:00 <Username> Message goes here. 
jan 01 00:00:00 * Username Action goes here. 

가 컴파일 문은 다음과 같습니다 여기

는 로그 형식의 예입니다 사용자 회담 및/me 명령을 사용할 때 -이 두 가지에 대해 하나의 슈퍼 정규 표현식을 작성하는 것은 가능할 수 있지만 그럴만큼 충분한 두통이 있습니다.

누구든지 나를 식별 할 수 있습니까?

답변

0

[0-9:] 클래스는 하나만 문자와 일치합니다 (8 개가 아닙니다). 한정 기호를 추가하십시오 :

findusername = re.compile("^[a-zA-Z]+\s[0-9]+\s[0-9:]{8}\s<([A-Za-z]+)>") 
finduseraction = re.compile("^[a-zA-Z]+\s[0-9]+\s[0-9:]{8}\s\*\s+([A-Za-z]+)\s") 

이렇게하면 별도의 줄에 각 항목을 입력해야합니다. 한 번에 여러 줄로 구성된 로그 텍스트 인 경우 re.MULTILINE 플래그를 추가하십시오.

사용자의 입력 예에 .findall()re.MULTILINE 플래그를 사용하여 데모 :

>>> findusername = re.compile("^[a-zA-Z]+\s[0-9]+\s[0-9:]{8}\s<([A-Za-z]+)>", re.MULTILINE) 
>>> finduseraction = re.compile("^[a-zA-Z]+\s[0-9]+\s[0-9:]{8}\s\*\s+([A-Za-z]+)\s", re.MULTILINE) 
>>> findusername.findall(logs) 
['FishCream', 'LpSamuelm', 'Username'] 
>>> finduseraction.findall(logs) 
['Username'] 
+0

오 와우, 내가 그것을 잡을하지 않았다 믿을 수 없다. 정말 고맙습니다! 당신은 부수적으로 나에게 익숙하지 않은 집합 한정 기호에 대한 구문을 도와주었습니다. – obskyr