내가 모두 대문자와 잠재적 소문자 여기 regex를 사용하여 문자열의 소문자를 모두 찾아 목록에 추가합니다. 파이썬
이 문자열에서 소문자 값을 얻을 수있는 방법을 찾고 있어요 것은이 내가 출력 에 원하는 것입니다sequences = ['CABCABCABdefgdefgdefgCABCAB','FEGFEGFEGwowhelloFEGFEGonemoreFEG','NONEARELOWERCASE'] #sequences with uppercase and potentially lowercase letters
예입니다
upper_output = ['CABCABCABCABCAB','FEGFEGFEGFEGFEGFEG','NONEARELOWERCASE'] #the upper case letters joined together
lower_output = [['defgdefgdefg'],['wowhello','onemore'],[]] #the lower case letters in lists within lists
lower_indx = [[9],[9,23],[]] #where the lower case values occur in the original sequence
그래서 lower_output 목록을 SUBLISTS의 목록으로 만들고 싶습니다. SUBLISTS는 모든 소문자 문자열을 갖습니다.
정규식을 사용하려고 생각했습니다. . . 소문자 목록 내가하려고했던 대한
import re
lower_indx = []
for seq in sequences:
lower_indx.append(re.findall("[a-z]", seq).start())
print lower_indx
:
lower_output = []
for seq in sequences:
temp = ''
temp = re.findall("[a-z]", seq)
lower_output.append(temp)
print lower_output
을하지만 값이 별도의 목록에없는 정규식에서 별도로
[['d', 'e', 'f', 'g', 'd', 'e', 'f', 'g', 'd', 'e', 'f', 'g'], ['w', 'o', 'w', 'h', 'e', 'l', 'l', 'o', 'o', 'n', 'e', 'm', 'o', 'r', 'e'], []]
... 그래서 질문은 무엇입니까 ? 정규 표현식을 사용하여 모든 것을 한 번에 캡처하는 방법을 알아야합니까? 아니면 문자에 참여해야합니까? –
'[a-z] +'시도해보기 – JDB
목록이 아닌 목록을 알파가 아닌 부분으로 나눠서 왜 폭발시키지 않겠습니까? –