腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
用
Beautifulsoup
提取
HTML
的
无
标签
文本
、
、
我试图
提取
文本
的
这一部分,但我不知道怎么做,我在本地处理了几个
html
文件。编辑:我试过使用这段代码,但有时会打印h1标记from bs4 import
BeautifulSoup
with open(file) a
浏览 6
提问于2016-08-10
得票数 1
回答已采纳
2
回答
使用
BeautifulSoup
在标记边界上断开单词
、
我正在尝试用
BeautifulSoup
将
html
解析为
文本
,但我遇到了一个问题:一些单词被没有空格
的
标签
分割:所以当我
提取
文本
时有没有一种简单
的
方法可以
用
BeautifulSoup
在
标签
上强制进行单词分隔?也可能是我可以修复一些
标签
上<e
浏览 13
提问于2018-08-10
得票数 0
2
回答
在
BeautifulSoup
4,Python3中,如何停止在已找到
的
标记中递归?
、
、
我
的
html
文档看起来如下:<body> outer font我想要
提取
‘字体’
标签
之间
的
所有
文本
。预期产出:inner font我试过
的
是: <e
浏览 5
提问于2015-05-22
得票数 1
回答已采纳
3
回答
如何使用
BeautifulSoup
查找第一个锚
标签
的
文本
、
我有一个这样
的
HTML
结构 <a href="abc.com"> </a> <ahref="xyz.com">comments</a></p> 我想
提取
第一个锚
标签
<em
浏览 1
提问于2016-04-28
得票数 1
1
回答
如何告诉
BeautifulSoup
将特定
标签
的
内容
提取
为
文本
?(不接触它)
、
、
我需要解析一个包含"code“
标签
的
html
文档。我得到
的
代码块如下:code_blocks = soup.findAll('code') List<Person> persons = new List<Person>();
浏览 0
提问于2011-02-07
得票数 4
回答已采纳
2
回答
从包含br标记
的
td标记中
提取
文本
、
、
我想从td
标签
中
提取
包含br
标签
的
文本
。from bs4 import
BeautifulSoup
soup=
BeautifulSoup
(
html
, '
浏览 0
提问于2018-03-14
得票数 1
回答已采纳
1
回答
BeautifulSoup
:从
html
标记中
提取
/解析数据
、
、
、
我试图使用Python代码中
的
Beautiful从url中
提取
体育数据。这个数据源
的
问题是数据出现在
html
标记中。具体来说,这个
标签
的
标题是"“返回:
无
如何从"“
html
标记中
提取
这些数据。在此之后,我希望将其保存为XML文件,或者更好
的
是,CSV文件将是理想<e
浏览 5
提问于2021-04-08
得票数 0
回答已采纳
3
回答
如何
提取
带有
标签
的
标签
内
的
文本
?
、
我想使用
beautifulsoup
解析
html
页面。我希望在不删除
html
标签
的
情况下
提取
标签
中
的
文本
。Router link not working</b>样本输出:我试过这样做: from bs4 import
Beautiful
浏览 10
提问于2019-10-11
得票数 2
回答已采纳
3
回答
如何解析
html
文件中
的
文本
import urllib2from HTMLParser import HTMLParser l = ""TransMembrane prediction using Hidden Markov Models: <a href="http://tuberculist.epfl.ch/tmhmm/Rv3676.
html
><big>Genomic sequence<
浏览 3
提问于2016-10-04
得票数 1
回答已采纳
1
回答
从
html
文档中
提取
标记内
的
文本
、
、
、
、
我有一个类似于这样
的
html
文档:,所以我需要在标记<span id="1“和</span内
提取
文本
,但我不知道如何
提取
。我试着写这段代码: soup =
BeautifulSoup
(fp,features="
html
.parser") for
浏览 5
提问于2021-05-19
得票数 3
回答已采纳
3
回答
用
BeautifulSoup
提取
标签
中
的
文本
、
、
、
、
Putonghua</p> </div> 我想
提取
第5行中
的
“男性”,但我不知道怎么做。
浏览 8
提问于2016-09-05
得票数 0
回答已采纳
2
回答
Python BS4美汤
HTML
.Parser在网站上不起作用
、
我有Python3.7代码,尝试从以下网站()
提取
足球统计数据。看起来我在BS4美丽汤中使用
的
超
文本
标记语言解析器根本没有
提取
网站中
的
任何
标签
。我首先尝试
提取
特定
的
标签
,比如表示主队和客队
的
两个不同
的
div
标签
,以及包含球员姓名
的
标签
。当这呈现了一个空
的
标签
列表时,我只是简单地尝试
提取
该网站上
浏览 26
提问于2019-07-13
得票数 2
回答已采纳
2
回答
如何
提取
bs4.element.Tag
的
第一个元素?
、
、
我想
提取
在自以为是之前
的
数字,我可以找到包含它
的
span,但我无法检索它。-- --> opiniones</span>}] 如何
提取
评论数量中
的
数字?
浏览 5
提问于2021-10-29
得票数 0
回答已采纳
1
回答
如何从网页上
的
特定部分中
提取
链接
、
、
有没有办法从
html
检查器中
提取
所有部分
的
链接(我
用
红色圈出
的
地方),它看起来像是在"performance-section“类下面,也在"heading”类下面。我
的
想法是从“性能部分”开始,最后到达"a“
标签
href以获得链接。 ? ? 我尝试使用下面的代码,但它给我
的
结果是“
无
”。我停在这里,因为如果我在得到"a“
标签
之前就已经没有得到任何东西,那么我认为继续下去
浏览 28
提问于2021-10-02
得票数 0
回答已采纳
1
回答
在使用lxml剥离
html
标记时插入空格
、
、
、
当我剥离
标签
并使用lxml
提取
文本
时,我希望在结果
文本
中插入空格。import lxml return str(lxml.
html
.fromstring(s).text_content())strip_
html
("<p>This what you want.&
浏览 1
提问于2022-04-13
得票数 0
回答已采纳
2
回答
一种带有美汤
的
咏叹调
标签
的
数据采集
、
、
、
从下面,我试图
提取
分析师
的
价格目标。我对咏叹调
标签
里
的
信息很感兴趣。我尝试使用以下设置在网上找到多个版本
的
BeautifulSoup
:from bs4 import
BeautifulSoup
r = requests.get(url, headers=headers) soup =
BeautifulSoup
(r.text, '
浏览 3
提问于2021-02-17
得票数 0
回答已采纳
1
回答
(Python、
BeautifulSoup
)创建或修改不带锚点标记
的
锚点
文本
列表
、
、
、
、
我是Python
的
新手,我正在尝试构建一个从网站
提取
一些
文本
并将其粘贴到Google电子表格中
的
脚本。
文本
是
用
标签
包装在网站上
的
标题。我使用
BeautifulSoup
(也导入了pygspread )来
提取
标题,如下所示: target_url = 'WEBSITE URL' r = requests.get(target_url)soup =
BeautifulSoup
(r.
浏览 16
提问于2019-12-24
得票数 0
回答已采纳
1
回答
如何从Beautiful Soup中
的
嵌套
标签
中
提取
文本
?
、
、
、
我希望网络抓取谷歌
的
结果,并希望获得出现
的
第一块信息。如何指定要从中
提取
文本
的
特定
HTML
路径?import requestsfrom bs4 import
BeautifulSoup
suffix = "Weather"results = requests.get(url) # Extract all conten
浏览 0
提问于2019-06-25
得票数 0
1
回答
利用优美汤
提取
span
标签
、
我试着
用
漂亮汤来
提取
跨度
标签
,代码没有输出。soup =
BeautifulSoup
(
html
, "
html
.parser")for tag in tags:
标签
:<tr><
浏览 7
提问于2021-12-26
得票数 0
回答已采纳
1
回答
使用python从
html
中
提取
<和>
、
、
我有一个UTF-8编码
的
HTML
,如下所示。我想用python和bs4从这里
提取
OWNER,NVCODE,CKHEWAT
标签
。但是<>被转换为<和>我不能从OWNER,NVCODE,CKHEWAT
标签
中
提取
文本
。 请指导我从这些
标签
中
提取
文本
。 <?xml version="1.0" encoding="utf-8"?><
htm
浏览 37
提问于2019-03-23
得票数 0
点击加载更多
相关
资讯
简单几行代码提取html文件中全部指定标签内的文本
python教程|如何批量从大量异构网站网页中获取其主要文本?
Python爬虫从入门到精通(3):BeautifulSoup用法总结及多线程爬虫爬取糗事百科
享学课堂浅谈Python3中BeautifulSoup的使用方法
使用多个Python库开发网页爬虫(一)
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券