腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
html.parser
提取
文本
/
解析
文本
(
Python
)
、
、
我想从html文件中
提取
文本
,特别是从<p>和<h1>标记中
提取
文本
。我确实看到了
python
文档中有关此主题的代码:来自
html.parser
导入HTMLParser class MyHTMLParser(HTMLParser): def handle_starttag</h1></body></html>') 但我不确定如何从这里开始,以便只
提取
某些标记内的<
浏览 15
提问于2020-11-05
得票数 1
回答已采纳
1
回答
尝试
使用
python
解析
html时重定向到主页
、
、
、
、
www.csgolounge.com/api/mathes"data = page.text我尝试
使用
此代码从获取
文本
,但每次尝试从页面获取
文本
时,我都会被重定向到主页,并且我的代码会从主页输出html。我试图抓取的页面是一个.php文件,而不是html或
文本
文件。我想从页面中获取
文本
浏览 0
提问于2016-11-02
得票数 0
1
回答
AttributeError:'str‘对象在
使用
BeautifulSoup时没有属性’子代‘错误
、
、
所以我对
Python
的
使用
完全陌生,我只是想打印一个网页的标题。我
使用
的代码主要来自google:import requests url = "https://www150.
浏览 0
提问于2019-06-24
得票数 2
1
回答
统一码在
html.parser
中的消失
、
、
、
、
我从一些具有Unicode字符的网页中
提取
HTML,如下所示: """ Adapted from
Python
3_Google_Search.py """我
使用
html.parser
来
解析
超
文本
标记语言并子类化它:class Parser(HTMLParser): def __init__(
浏览 2
提问于2013-05-04
得票数 0
1
回答
将cp1251 pdf
解析
为
python
中的
文本
、
、
、
有什么方法可以用俄文(cp1251)从pdf文件中
提取
文本
吗? 对于
解析
pdf文件,我
使用
pdfminer包。
浏览 7
提问于2015-08-26
得票数 1
回答已采纳
3
回答
如何
使用
BeautifulSoup查找第一个锚标签的
文本
、
abc.com"> </a> <a href="xyz.com">comments</a></p>下面是我如何
使用
Beautifulsoup从锚标记中
提取
文本
soup = BeautifulSo
浏览 1
提问于2016-04-28
得票数 1
1
回答
如何用
Python
中的BeautifulSoup
解析
多体标记中的
文本
?
、
、
我想
解析
这个网站:<span class="sharenumber" id="fb_share_span">2830</span>from bs4 import BeautifulSoup res = requests.get("https://ww
浏览 2
提问于2015-12-20
得票数 2
回答已采纳
2
回答
美丽的汤和表格抓取- lxml与html
解析
器
、
、
、
、
我正在尝试
使用
BeautifulSoup从网页中
提取
表格的超
文本
标记语言代码。我想知道为什么下面的代码与"
html.parser
"一起工作,并打印回none,如果我将"
html.parser
"更改为"lxml"。 #!/usr/bin
浏览 3
提问于2014-09-08
得票数 14
回答已采纳
2
回答
Python
BS4美汤
HTML.Parser
在网站上不起作用
、
我有
Python
3.7代码,尝试从以下网站()
提取
足球统计数据。看起来我在BS4美丽汤中
使用
的超
文本
标记语言
解析
器根本没有
提取
网站中的任何标签。我首先尝试
提取
特定的标签,比如表示主队和客队的两个不同的div标签,以及包含球员姓名的标签。当这呈现了一个空的标签列表时,我只是简单地尝试
提取
该网站上的所有div标签,但我仍然得到了一个空列表。下面是我
使用
的代码:from bs4 impor
浏览 26
提问于2019-07-13
得票数 2
回答已采纳
2
回答
美丽汤UserWarning:没有显式指定
解析
器
、
、
我只想从源代码中
提取
文本
(html代码是div id“col”)。当我只想
提取
source_code中的
文本
时,会发出警告。page_response = requests.get(page_link, timeout=5)Warning (from warnings module): File "C:/Users/Emre
浏览 0
提问于2019-02-18
得票数 1
回答已采纳
2
回答
将
Python
BeatifoulSoup中的结果保存到文件
、
、
我正在尝试将从Wikipedia URL
提取
/
解析
文本
的BeatifoulSoup迭代的结果保存到
文本
文件中。当我迭代我的循环来
解析
句子时,我没有成功地创建
文本
文件并添加
文本
。我想将我的代码输出发送到一个
文本
文件。打印到屏幕工作正常。希望你能指引我到这里来。en.wikipedia.org/wiki/Santiago" soup = Be
浏览 35
提问于2021-08-09
得票数 1
1
回答
从docx表中
提取
URL
、
、
、
我用
python
3编写了一个
解析
器,
使用
python
-docx库
提取
现有.docx中的所有表,并将其存储在
python
3中。 到目前一切尚好。它应该起作用的。未提供url或显示
文本
。我发现很多人对此也有类似的担忧,但大多数人似乎并没有“只是这样”的两难处境。我考虑解压缩.docx并扫描_ref文档以找到相应的“rid”,并
使用
在_ref xml中找到的链接填充实际数据。
浏览 4
提问于2018-11-12
得票数 0
1
回答
BeautifulSoup -从JS中
提取
特定的JSON键值
、
、
、
、
SID is used by the Moving Leads Service我能够通过BeautifulSoup
提取
浏览 1
提问于2017-05-08
得票数 5
回答已采纳
3
回答
如何
提取
带有标签的标签内的
文本
?
、
我想
使用
beautifulsoup
解析
html页面。我希望在不删除html标签的情况下
提取
标签中的
文本
。"> </a>'print(soup.text)'Angular2 Ro
浏览 10
提问于2019-10-11
得票数 2
回答已采纳
1
回答
用BeautifulSoup
提取
文本
、
我正在尝试从一个旧的网页中
提取
文本
,并且遇到了麻烦。检查网页()的来源时,
文本
开始:我尝试
使用
以下方法
提取
文本
: link = "http://w
浏览 2
提问于2017-11-25
得票数 0
回答已采纳
3
回答
将PDF转换为.ipynb (从PDF中恢复木星笔记本)
、
、
我有一个PDF文件是从木星笔记本创建的,但是原始的.ipynb文件丢失了。有什么工具可以帮助将PDF转换成.ipynb吗?
浏览 2
提问于2020-06-24
得票数 0
1
回答
BeautifulSoup:不可序列化
、
我有其他人为
Python
2编写的代码,我将其转换为
Python
3: r = self.make_request", line 201, in encode File "/usr/local/lib/
python
3.5/json/encoder.py", line&
浏览 0
提问于2016-09-07
得票数 0
1
回答
以输入表单和刮页、
Python
、请求库发送POST数据
、
、
、
我有问题。我不知道我怎么能发送的文章数据和刮内容的下一页。更好地理解的简单例子:输入: 我想要制作
浏览 1
提问于2017-04-02
得票数 1
3
回答
Python
循环或输出-仅在我的计算机上
、
、
我有一个奇怪的问题,我的计算机对这个
python
脚本的反应与其他人的计算机不同(我在macOX Mountain Lion
python
v=2.7上)。
浏览 1
提问于2013-04-10
得票数 2
回答已采纳
4
回答
漂亮的汤类
html.parser
错误
、
我正在尝试
使用
BeautifulSoup来
解析
来自网址的超
文本
标记语言数据。然而,我一直收到警告: BeautifulSoup([your
浏览 0
提问于2016-03-24
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python解析“Unicode”编码格式文本
文本提取函数
Python工具教你提取文本名词短语
文本提取仨兄弟
如何用Python从PDF文件中提取文本词汇
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券