腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
beautifulSoup
检索
html
标记
内容
、
、
我正在尝试使用python获取一篇网站文章
的
纯文本。我听说过
BeautifulSoup
库,但是如
何在
html
页面
中
检索
特定
的
标记
呢?这就是我所做
的
: base_url = 'http://www.nytimes.com'soup =
BeautifulSoup
(r.text,"
html
.pars
浏览 14
提问于2021-01-27
得票数 1
回答已采纳
1
回答
如何通过Python
BeautifulSoup
中
的
特定文本找到
标记
?
、
、
、
您知道如
何在
pythons
BeautifulSoup
中
搜索特定
的
文本吗?查找
标记
??更好
的
标记
完整路径,包含一些string。例如,BS4
的
常用用法是:from bs4 import
BeautifulSoup
website = requests.get(ur
浏览 4
提问于2022-09-04
得票数 0
回答已采纳
1
回答
BeautifulSoup
,
检索
<td>
标记
的
所有子<a>
标记
的
文本
、
、
我想
检索
页面中所有<a>
标记
的
文本,这些
标记
位于<td>
标记
中
。这里是
Html
源代码
的
一部分
, <a href="https://random.com"></a> </td&g
浏览 0
提问于2017-05-21
得票数 0
回答已采纳
2
回答
如
何在
BeautifulSoup
中
检索
html
标记
的
一部分
?
、
这是我用来从网页中提取这个标签
的
代码: director = movies[0].find_all("a") 我想使用
BeautifulSoup
从下面的HMTL
标记
中提取导演Frank Databont
浏览 26
提问于2021-10-15
得票数 0
回答已采纳
1
回答
使用
BeautifulSoup
清理和删除
标记
、
、
、
到目前为止,我有以下脚本:from
BeautifulSoup
import
BeautifulSoup
importurllib2 br.open("http://www.foo.com") <b><span class="pai
浏览 0
提问于2010-06-30
得票数 0
回答已采纳
2
回答
用
BeautifulSoup
或Regex解析无效锚
标记
、
、
、
、
我希望解析包含
html
锚
标记
的
原始文档,但不幸
的
是它包含无效
标记
,
如
:我知道href值可能不是一个实际
的
链接,但让我们把它留在这里吧现在我需要
的
是
检索
href值'A 4"drive bay'和链接文本'some text here'。
浏览 4
提问于2012-05-07
得票数 0
2
回答
如何从以下
HTML
代码中提取文本?
、
、
、
我正在为一个DS项目做web抓取,我使用
BeautifulSoup
来实现这个目的。但我无法从"table“类
中
的
"tbody”
标记
中提取持续时间。以下是
HTML
代码: <table class="table"> <tr>
浏览 7
提问于2020-05-26
得票数 0
回答已采纳
1
回答
美汤结果缺失
的
部分
、
我试图在下面的
html
代码
中
检索
几个<p>
标记
。这里只是它
的
一部分
<a class="fBlackLink"></a> <span> … </我
的
Python代码如下 soup =
Beautifu
浏览 3
提问于2013-09-04
得票数 9
回答已采纳
3
回答
如何使用
BeautifulSoup
删除嵌套
标记
中
的
内容?
、
、
、
如何使用
BeautifulSoup
删除嵌套
标记
中
的
内容?这些帖子显示了反向
检索
嵌套
标记
中
的
内容:和>>> from bs4 import
BeautifulSoup
as bs >>>
html
= "<foo>Somethingsomething <bar> blah blah<
浏览 0
提问于2014-02-13
得票数 3
回答已采纳
1
回答
从网站请求完整
的
javascript呈现
html
源,并找到所有iframe
标记
。
、
、
、
、
我目前正在尝试使用selenium和
BeautifulSoup
从一个网站
检索
所有iframe
标记
。问题是,我没有得到所有的iframes,因为网页中有BS4没有搜索
的
内部
html
文档,而且我也不认为javascript是在
HTML
中
执行
的
,所以可能有一些
HTML
元素没有被呈现。是否有一个web刮取工具,允许我请求一个url,
检索
完整
的
js呈现
的
HTML
文件,然后搜
浏览 2
提问于2017-11-11
得票数 3
回答已采纳
2
回答
BeautifulSoup
4:打开URL
的
FileNotFoundError
、
我正在使用
BeautifulSoup
4抓取一个站点。以下是我所拥有的内容
的
精简版本: soup =
BeautifulSoup
id=11325") File "SquashScraper.py", line 21, in getTeamRoster s
浏览 2
提问于2015-06-02
得票数 2
3
回答
Beautifulsoup
4删除<span>
标记
、
、
、
我正在使用这一行从网站上抓取信息这给了我这个结果:出于某种原因,当我试图拆开它时,它给了我这个而不是8.668
浏览 4
提问于2014-04-03
得票数 0
回答已采纳
1
回答
如何删除漂亮对象
中
的
所有
标记
,而不删除特定
的
标记
,
如
<strong>或<em>?
、
、
给定以下
html
,如
何在
BeautifulSoup
中
删除除样式
标记
(
如
<strong>或<em> )之外
的
所有
标记
? <ol class="journal"> <li>A.19597-w" rel="nofollow" target="_blank">10.1038/s41467-020-19597-w<
浏览 9
提问于2020-12-01
得票数 0
1
回答
python -
html
-如何更改
标记
的
结束部分
的
位置/移动整个部分
、
、
我想通过从一个地方移除并放置到另一个地方来改变标签结束部分
的
位置。我尝试使用
BeautifulSoup
,但是函数似乎在整个
标记
上工作。我不知道如何移动标签
的
一部分
,比如</div>,而不破坏标签
的
后续部分。如何更改
标记
的
结束部分
的
位置
html
= """ <body>
浏览 0
提问于2018-11-29
得票数 0
回答已采纳
3
回答
如
何在
BeautifulSoup
中
添加已删除
标记
周围
的
空间
、
、
、
from
BeautifulSoup
import
BeautifulSoup
Poem <a href="http://famouspoetsandpoems.com(
html
)for p
浏览 4
提问于2015-06-30
得票数 10
回答已采纳
1
回答
用
BeautifulSoup
验证
HTML
、
、
我使用
BeautifulSoup
3.2.1解析了许多eTranslation翻译
的
文件。我发现soup =
BeautifulSoup
(
html
_file, "
html
.parser")有时会剪掉我
的
HTML
文件
的
一部分
。它与无效
标记
或
HTML
中发现
的
问题有关。此外,我发现soup =
BeautifulSoup
(
html
_
浏览 5
提问于2022-09-27
得票数 0
回答已采纳
2
回答
如何防止
BeautifulSoup
自动关闭看起来像标签但不是标签
的
东西?
、
、
我使用
BeautifulSoup
来转义任意文本集中
的
所有
HTML
标记
(除了一组预先批准
的
标记
,
如
a)。但是,我只想让它在
标记
是实际有效
的
HTML
标记
时对它们进行转义。如果某个东西看起来像一个
标记
,但它不是,它最终会添加一些
HTML
来关闭它,这是我不想要
的
。示例:如果有人输入文本<integer>,我
的
代码最终会输出&
浏览 0
提问于2012-01-14
得票数 2
回答已采纳
3
回答
用
BeautifulSoup
在
HTML
中
搜索和替换
、
我知道如何用urllib2打开,然后解析以提取所有的<a>
标记
。我想要做
的
是搜索并用结束
标记
替换结束
标记
加上中断。任何帮助,非常感谢。我认为这将类似于:find(text="ahh").replaceWith('Hooray')soup.findAll(tag = '</a>').re
浏览 0
提问于2010-01-15
得票数 13
回答已采纳
2
回答
美丽
的
汤选择google图像返回空列表
、
、
我想使用从
BeautifulSoup
检索
信息。我检查了许多堆栈溢出帖子(、、、、),但仍然无法
检索
信息。我希望每个瓷砖(图片)
的
(li)信息,
如
href,然而,find_all和select one返回空列表或无。下面是我尝试过
的
。import requests from bs4 import
Beau
浏览 14
提问于2021-12-05
得票数 3
回答已采纳
4
回答
获取特定行
的
内容
、
、
、
我想要定位文本是'xyz‘
的
'td’,这样我就可以在行中找到其他属性。我只带了'xyz‘,并希望获得该行
中
的
其他元素。. .
浏览 0
提问于2019-05-31
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Python进行网页抓取的介绍
爬虫入门——详解Python是如何进行网页抓取!
如何在电脑上剪切掉视频中的一部分?
Python 爬虫(五)
BeautifulSoup解析库select方法实例——获取企业信息
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券