现在有了下面的代码,它可以很好地工作,用于获取2个字符串,并标识匹配的区域,如第三行输出所示。
我想对代码的下一部分说--从0到第一个匹配字符串结束的地方--从s2中删除这个部分,所以对于给定的示例,删除从0到9。但是,只有当它从0开始时才这样做。我不知道如何处理嵌套列表,所以对代码所做的解释将是很棒的。
from collections import defaultdict
from itertools import groupby
def class_chars(chrs):
if 'N' in chrs:
return 'unknown'
elif chrs[0] == chrs[1]:
return 'match'
else:
return 'not_match'
s1 = 'aaaaaaaaaaN123bbbbbbbbbbQccc'
s2 = 'aaaaaaaaaaN456bbbbbbbbbbPccc'
n = 0
consec_matches = []
chars = defaultdict(int)
for k, group in groupby(zip(s1, s2), class_chars):
elems = len(list(group))
chars[k] += elems
if k == 'match':
consec_matches.append((n, n+elems-1))
n += elems
print chars
print consec_matches
print [x for x in consec_matches if x[1]-x[0] >= 9]
输出:
defaultdict(<type 'int'>, {'not_match': 4, 'unknown': 1, 'match': 23})
[(0, 9), (14, 23), (25, 27)]
[(0, 9), (14, 23)]
发布于 2014-05-09 10:50:44
我不确定我完全得到了你想要的东西,但是你可以用以下方法指出我的方向:
In [12]: l=[(0, 9), (14, 23), (25, 27)]
In [13]: flatten_l= [x for y in l for x in y]
In [14]: flatten_l
Out[14]: [0, 9, 14, 23, 25, 27]
# access second tuple arg if first is equal to 0
In [15]: get_num_after=[y[1] for y in l for x in y if x ==0 ]
In [16]: get_num_after
Out[16]: [9]
https://stackoverflow.com/questions/23562226
复制相似问题