首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Python正则表达式-限制结果?

Python正则表达式-限制结果?
EN

Stack Overflow用户
提问于 2012-08-10 21:11:28
回答 1查看 1.4K关注 0票数 2

我觉得这样问有点愚蠢,但我已经创建了一些正则表达式来在HTML文档中查找特定的企业、地址和URL。问题是……我不知道我应该使用哪一个(python)正则表达式。当我使用re.findall时,我会得到30到90个结果。我想把它限制在3或5(一组数字)。我应该使用哪个正则表达式操作来完成此操作,或者是否有一个参数可以在搜索达到一定数量的结果时停止搜索?

此外,有没有一种更快的方法来搜索HTML文档,这样我的程序就不会因为正则表达式搜索这个非常长的“字符串”文本而变慢?

谢谢。

编辑

我有Beautiful Soup,我用它来简化read...but而不是解析。

我也用过lxml...which更好/更快?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-08-11 09:11:39

使用re.finditer而不是re.findall。它返回一个迭代器,该迭代器根据需要生成下一个匹配。

下面是一个例子:

代码语言:javascript
运行
复制
>>> [m.group(0) for m, _ in zip(re.finditer(r"\w", "abcdef"), range(3))]
['a', 'b', 'c']
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11902378

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档