腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
BeautifulSoup4
:
解析
格式
错误
的
HTML
、
、
、
我正在尝试
解析
一组列出有关智能手机移动设备
的
信息
的
表。例如this link。我正在尝试获取4个我需要
的
特定字段,而获取第四个字段会让我抓狂。 看起来
HTML
的
格式
很糟糕。我们将几个表按顺序放入
html
中。实际上,如果我只是使用一个选择器来获取所有的表,它只会选择前6个表: dsoup = BeautifulSoup(dr.content, '
html
.parser') dselnt
浏览 9
提问于2019-12-12
得票数 0
回答已采纳
2
回答
Python3.6 BeautifulSoup不工作
、
、
、
、
我
的
密码如下所示;plain_text = source_code.text或
html
= r.content我在编写“BeautifulSoup=任何东西”时都犯了
错
浏览 0
提问于2017-03-20
得票数 0
回答已采纳
4
回答
Python web抓取
.*)</span>'我
的
输出是: Govt has nothing to do with former CAG official
浏览 1
提问于2012-11-24
得票数 0
3
回答
用Python中
的
pip命令安装模块
、
我尝试安装用于BeautifulSoup
解析
的
HTML
库。我试着使用pip命令。我已经完成了预演。我在路径中添加C:\Python27 27;。我运行它,输入python并导入pip。没事
的
我输入 File "<stdin>", line 1>>>python -m pip i
浏览 10
提问于2017-04-08
得票数 0
回答已采纳
1
回答
BeautifulSoup无法
解析
长视图状态
、
、
我尝试使用
BeautifulSoup4
解析
从检索到
的
html
,如果打印出结果
的
汤,它
的
结尾如下:搜索原始
html
中
的
最后一个字符9IjaI,我发现它位于一个巨大
的
viewstate
的
中间。有什么提示,我可能做错了什么,或者如何
解析<
浏览 1
提问于2013-08-09
得票数 0
回答已采纳
1
回答
已经有了BS4
的
html
解析
器:找不到树构建器.
html
解析
器
、
、
、
我使用
beautifulsoup4
在项目的目录中安装了requirment.txt: 当我试图导入和运行时,我得到了这个
错误
: from local_lib.bs4 import BeautifulSoupsoup = Beautifulsoup(
html
,
浏览 7
提问于2021-08-01
得票数 1
回答已采纳
1
回答
下载站点
的
HTML
页面并抓取它以获取所需
的
数据,因为他们没有公共api
、
所以我需要从一个网站获取一些数据,问题是他们没有一个公共
的
api,所以我想下载
html
文件,然后搜索我想要
的
数据。我只是不确定是否有可能这样做,我认为这应该是正确
的
?流程是这样
的
我不确定如何以字符串
的
形式抓取页面,因为页面有一个类似于表
的
数据,他们实际上有一个xml文件
的
公共api,但它排除了我想要
的
数据,这就是
浏览 2
提问于2019-08-28
得票数 0
1
回答
如何从注释块中抓取数据并创建数据?
、
、
、
、
我试图从棒球场参考网站上提取
HTML
数据。我想去他们
的
网站,查看页面源,
html
标签就会在
html
代码本身中。但是,经过进一步
的
调查,我关心
的
html
标记集都在注释块中。-并且直到
HTML
文件几乎结束时才结束。 我可以用下面的代码提取
HTML
注释,但它附带了一些问题。,它在一个列表中,我只关心有数据
的
那个,它附带了新
的
行标记,我很难把播放器
的
标准打击字符串代码转换成
html
浏览 3
提问于2022-05-28
得票数 1
回答已采纳
1
回答
如何获取pypi中
的
软件包总数?
、
pip list --format=columns |wc -l它显示我
的
本地pc上安装了73个软件包。 如何获取pypi远程官方服务器
的
套餐总数?
浏览 1
提问于2017-11-25
得票数 1
2
回答
如何从Gmail消息中获取可读文本,如果它包含
html
?
、
、
、
、
我使用Gmail API,我想从消息中获取所有人类可读
的
文本,一些消息是MIME文本/
html
格式
的
。有没有一种“正确”
的
方法呢?我尝试使用
BeautifulSoup4
(我使用Python语言),但有时文本会丢失,因为我使用标签过滤,否则,一些文本是不可读
的
。我使用了这个示例,并尝试对其进行微调: 也许你知道,如何做正确
的
解析
,或者使用一些Gmail API特性?
浏览 14
提问于2020-03-13
得票数 1
1
回答
如何在python请求中重定向之后获得最终
的
目标URL?
、
、
需要来自实际目标URL
的
响应。我想以编程
的
方式获得这个URL。 编辑,如注释中所示,对目标的最后调用是使用JS进行
的
。
浏览 2
提问于2022-02-01
得票数 0
回答已采纳
1
回答
如何使用python转换
html
数据
、
我正在寻找一条建议,因为我是python
的
新手。如下所示:有时br
的
数量是不同
的
,并且对于所有块来说不是恒定
的
。我
的
目的是从td块中提取数据到文件中,但是我停留在
浏览 0
提问于2013-06-10
得票数 0
回答已采纳
1
回答
BeautifulSoup4
解析
html
、
、
、
我需要抓取所有的高中名称连同他们
的
城市从这个网站。使用
BeautifulSoup4
。我在下面添加了none工作代码。非常感谢。
浏览 1
提问于2014-08-08
得票数 0
2
回答
Python
的
XPath在<p>标记中找不到<ul>
、
、
我对pythons
的
XPath函数有问题。下面的python代码就是一个很小
的
例子: <p class="goal"> <ul><li>test</li></ul&g
浏览 2
提问于2015-10-24
得票数 1
回答已采纳
1
回答
抓取aspx页面的Python代码是什么?
、
、
、
、
我
的
要求是将mcode传递给下面的web aspx查询,然后将结果网页打印到pdf。在上面的url中,唯一
的
变量是99999。因此,我
的
目标是每次传递mcode,然后将生成
的
aspx页面打印为pdf。请原谅我
的
简体语言,因为我对此还不熟悉。
浏览 2
提问于2020-03-18
得票数 0
1
回答
从python中
的
Selenium Webdriver实例中获取文本
、
、
如何才能获得Webdriver实例
的
所有文本?获取Webelement
的
文本非常简单,例如,或但是,为了从Webdriver获得它,我没有找到类似的解决方案我刚想出了以下两步
的
方法:driver.find_element_by_tag_name('body').text 但在我看来必须有更好
的
方法..。
浏览 2
提问于2016-11-24
得票数 0
回答已采纳
1
回答
为什么无法使用Jupyterlab中
的
BeautifulSoup4
解析
本地文件
、
、
我正在遵循一个网络教程,尝试使用
BeautifulSoup4
从Jupyterlab中
的
html
文件(存储在我
的
本地PC上)中提取数据,如下所示: from bs4 import BeautifulSoup()) 不管
html
文件中是什么,而不是预期
的
html
,我都会得到以下输出 <
html
> <p> </p> <
浏览 19
提问于2020-10-03
得票数 1
回答已采纳
1
回答
美汤还空套装
、
、
import urllib2
html
= url.read()打印
Html
会正确输出google
的
网页。这与安装
解析
器有关吗?我查找了一些其他可能
的
解决方案,他们提到安装
解析
器,但到目前为止还没有成功。 此解决方案不适用于我<
浏览 0
提问于2013-11-29
得票数 0
1
回答
在Visual Studio2015中使用pip安装"urllib2“后,”没有名为urllib2
的
模块“
、
、
我已经在Visual Studio2015中使用pip by interface安装了"urllib2“,但是调试器在”导入urllib2“行得到
错误
。到目前为止,我已经使用以下方法解决了问题:
html
_doc = response.read()我
的
工作就是
解析
一个
浏览 0
提问于2015-11-14
得票数 0
1
回答
如何制作python项目的完整脱机安装程序
、
、
、
我想用这个requirements.txt为我
的
python项目编写完整
的
脱机安装程序Flask==0.11.1peewee==2.8.5pymongo==3.4.0PyYAML==3.12tqdm==4.10.0做这件事最好
的
方法是什么requirements.txt sudo
浏览 4
提问于2016-12-24
得票数 2
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券