腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
BeautifulSoup
:
如何
从
标签
中
获取
文档
元素
?
如果我只有一个
标签
,
如何
创建一个新的
标签
? def bold(tag): tag.wrap(b)
浏览 23
提问于2021-04-22
得票数 0
回答已采纳
1
回答
从
基于链接的网站拉取图片
、
、
、
我目前已经准备好了使用
BeautifulSoup
库来提取html
文档
中所有图像
标签
的代码。我想知道在Python
中
是否有一种方法可以通过图像标记
中
的link
元素
指向的图像以编程方式将图像下载到您的计算机上。这是我用来
获取
网页中所有图片
标签
的代码。import urllib2pa
浏览 0
提问于2013-04-13
得票数 0
回答已采纳
3
回答
无法
获取
开始标记和结束标记之间的文本
、
soup =
BeautifulSoup
("<p>'hello'<a>'my link'</a></p>", 'html.parser')None 输出是否正常
浏览 2
提问于2017-04-05
得票数 0
2
回答
Python正则表达式-提取每个表单元格内容
、
在python
中
获取
每个单元格值的最简单方法是什么。也就是说,我只想要存储在列表或数组
中
的值"123“、"234”、"697“,或者任何最简单的值。如果我不能用n个单元格来做这件事,你
如何
用一个固定数量的单元格来做这件事?
浏览 4
提问于2012-03-23
得票数 2
回答已采纳
1
回答
BeautifulSoup
只提取顶层标记。
、
、
、
、
我正在使用Python3.4
中
的
BeautifulSoup
进行一些网络抓取。现在,我在学习过程
中
遇到了一个问题:我试图
从
网页
中
获取
一个表行,并且我使用find_all()来
获取
它们,但是在表
中
--有更多的表中有表行!
如何
在
BeautifulSoup
中
只获得
标签
的顶级/一级通用或特定
元素
?
浏览 1
提问于2016-06-19
得票数 17
3
回答
如何
获取
汤代表的url?
、
如何
在
BeautifulSoup
之后
获取
页面的url?res = requests.get('http://www.example.com') soup =
BeautifulSoup
(res.text, 'lxml')
如何
从
汤
中
获取
http://www.example.com
浏览 9
提问于2019-06-18
得票数 0
回答已采纳
2
回答
在
BeautifulSoup
4
中
以unicode字符串的形式
获取
标记属性的内容
、
、
、
根据的说法,可以通过使用如下所示的代码来
获取
标记属性的值:tag = soup.b 理论上(也就是根据
文档
),输出应该是:但是,当我执行上面的代码时,它输出: ['
浏览 0
提问于2013-02-12
得票数 0
回答已采纳
2
回答
Python、
BeautifulSoup
- <div>文本和<img>属性按正确顺序排列
、
、
credits and golden credits使用img
标签
的我不知道
如何
依次遍历div-标记。我可以执行以下操作来提取div-标记
中
包含的所有文本print html.get_text() 要获得d
浏览 2
提问于2013-12-15
得票数 5
回答已采纳
3
回答
HTML标记之间的Selenium
、
、
、
将Javascript创建的页面
中
的所有超文本标记语言传递给
BeautifulSoup
的最佳方法是什么?selenium.common.exceptions import NoSuchElementExceptionbrowser.get("http://w
浏览 1
提问于2012-10-13
得票数 2
2
回答
Python美丽的汤参数
、
我有这段代码,它使用
BeautifulSoup
从
页面
获取
一些文本body = soup.find('div' , {'id':'body'})我想让它成为一个可重用的函数,它接受一些htmltext和
标签
来匹配它,如下所示 soup=
BeautifulSoup
(html) bodyparse(htmlp
浏览 0
提问于2010-04-03
得票数 8
回答已采纳
3
回答
漂亮的汤不返回HTML文件
中
的所有内容吗?
、
这里的HTML新手,所以我可能会误解一些关于HTML
文档
,所以请原谅我。import urllibpage = urllib.urlopen(url).read() soup =
BeautifulSoup
.
BeautifulSoup<
浏览 15
提问于2016-04-07
得票数 0
回答已采纳
3
回答
不能脱下段落
标签
、
、
这段代码是为了
从
bbc抓取新闻内容而写的。到目前为止,它可以工作,但在其中显示段落标记。我尝试过使用正则表达式删除html标记,但仍然无法工作。请帮我处理这个。谢谢from bs4 import
BeautifulSoup
from urllib2 import urlopen if counter<limit: newpage = url
浏览 6
提问于2014-07-14
得票数 0
回答已采纳
2
回答
从
HTML中提取brainfuck代码
、
、
<br /><br /><br />我使用的是Python和
BeautifulSoup
。我可以很好地
从
整个
文档
中
获取
div,但似乎无法
从
我该怎么做呢?谢谢在查看
BeautifulSoup
加载的内容之后,它似乎实际上删除了大量代码。请求内容包含了所有内容,但内容却没有。 除了
BeautifulSoup
之外,还有更好
浏览 1
提问于2014-04-14
得票数 3
3
回答
BeautifulSoup
如何
从
<a>
标签
中
获取
文本
、
、
我不知道
如何
从这门课中提取课文我想要7,457,但我不明白.我试过了,但它只给我显示了链接response = requests.get(url) soup =
浏览 1
提问于2020-10-20
得票数 0
回答已采纳
1
回答
如何
使用bs4
从
网站
获取
表格数据
、
我试图用bs4抓取一个网站,里面有一个表,但我得到的内容
元素
并不像我
从
inspect得到的那样完整。我在里面找不到
标签
<tr>和<td>。
如何
获取
该站点的完整内容,尤其是表格的标记?下面是我的代码: from bs4 import
BeautifulSoup
link = requests.get("https://pemilu2019.kpu.go.id/#/ppwp/
浏览 62
提问于2019-04-24
得票数 1
回答已采纳
1
回答
Python2.7-使用ajax在网页上搜索特定URL
、
、
我必须检索一个嵌套在网页
中
的URL。我试过以下代码,但它找不到主链接的URL (指向PDF)。import urllib2 if link is not None: print li
浏览 0
提问于2016-10-24
得票数 2
回答已采纳
1
回答
使用python获得nhl排名
、
、
我使用python和selenium编写了一个函数,以便在url上使用
BeautifulSoup
: d = webdriver.Chrome() result = d.page_source return soup我遇到了两个我不知道
如何
解决的问题: 1
浏览 3
提问于2016-11-02
得票数 0
1
回答
BS4‘
元素
’到底是什么,
元素
是
如何
计算的,由哪个解析器来决定?显然很迷惑
、
、
、
人们经常会遇到这种类型的for循环: from bs4 import
BeautifulSoup
as bssoup = bs(mystring,'html.parsernine</span></p> elem 10 <span style="some other style">text nine</span> 所以bs4+html.parser在字符串中找到了10个
元素
当然,额
浏览 15
提问于2019-05-08
得票数 1
回答已采纳
4
回答
如何
使用
BeautifulSoup
从
HTML
中
剥离注释标记?
、
我一直在玩
BeautifulSoup
,这很棒。我的最终目标是尝试
从
页面
中
获取
文本。我只是尝试
从
正文中
获取
文本,并使用一个特殊情况
从
<a>或<img>标记
中
获取
标题和/或alt属性。到目前为止,我有这个EDITED & UPDATED CURRENT CODEcomments = soup.findAll(text=lam
浏览 0
提问于2010-08-18
得票数 16
回答已采纳
2
回答
在web爬网过程
中
获取
CSS计算样式
、
有没有办法
从
页面源
中
获取
元素
的计算样式?或者,如果不是来自页面源代码,那么可以通过其他方式?现在,我使用Python
BeautifulSoup
来
获取
和遍历
文档
。这将
获取
所有
元素
及其属性,但不能
获取
css样式。理想情况下,这应该是使用Python,但我对使用其他语言持开放态度。我看了几个问题,它们似乎都与
从
“检查
元素
”或
从
使用javascript的您自己的个人页面
浏览 3
提问于2011-12-27
得票数 2
回答已采纳
点击加载更多
相关
资讯
如何获取PDF文档中的图片?
如何使用Python从列表中删除指定的元素
vlookup应用——如何从学号中获取班级信息
如何从机器学习数据中获取更多收益
Python爬虫从入门到精通(3):BeautifulSoup用法总结及多线程爬虫爬取糗事百科
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券