腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
在
Python
语言
中
使用
BeautifulSoup
从
HTML
Script
标签
中
提取
JSON
、
、
、
我有以下超文本标记
语言
,我应该如何
从
变量中
提取
JSON
:window.__INITIAL_STATE__ <!DOCTYPE doctype
html
> <
script
> /* <sl:tr
浏览 53
提问于2019-03-05
得票数 4
回答已采纳
3
回答
如何
使用
python
解析ld+
json
、
、
、
我一直
在
尝试一些网络抓取,我偶然发现了这个
标签
中
的一些有趣的数据:我已经能够用美丽的汤分离出那个
标签
soup =
BeautifulSoup
(
html
, "lxml") p = soup.find('
script
', {
浏览 2
提问于2017-04-27
得票数 9
4
回答
如何
使用
python
检测网页内容的
语言
是否有任何方法可以通过
使用
Python
语言
返回网页
中
的内容
语言
?就像如果页面是中文的,那么它应该返回`“中文”。 我用langdetect模块检查了它,但是无法得到我想要的结果。内容显示
在
<releasehigh>下
浏览 13
提问于2015-06-25
得票数 1
回答已采纳
0
回答
我如何通过
Beautifulsoup
获得这些
Json
代码?
JSON
var data2sales= "key": "Owners", "values": [ [1490572800000, 1982, "", "", ""], [149065920
浏览 0
提问于2017-06-24
得票数 4
2
回答
Python
中
脚本标记的Web抓取
、
、
、
、
我已经设法
使用
BeautifulSoup
.Then获取脚本标记,我将其转换为
json
对象。我想要的信息
在
data['x']
中
,但它被卡在b标记之间。infoinwant</br>columniwant: 123','<b>infoiwant</b><br>NA<br>columniwant: 123'</br>columniwant: 123 我该如何从这
浏览 5
提问于2020-09-11
得票数 0
2
回答
Python
BS4美汤
HTML
.Parser在网站上不起作用
、
我有
Python
3.7代码,尝试
从
以下网站()
提取
足球统计数据。看起来我
在
BS4美丽汤中
使用
的超文本标记
语言
解析器根本没有
提取
网站
中
的任何
标签
。我首先尝试
提取
特定的
标签
,比如表示主队和客队的两个不同的div
标签
,以及包含球员姓名的
标签
。当这呈现了一个空的
标签
列表时,我只是简单地尝试
提取
该网站上的所有div
标签
,
浏览 26
提问于2019-07-13
得票数 2
回答已采纳
1
回答
BeautifulSoup
-
从
JS中
提取
特定的
JSON
键值
、
、
、
、
我
在
玩BeautilfulSoup,我正在寻找一种
在
JS元素
中
获取特定
json
字符串的方法。这是JS:window.pinball.push(['add', {"srp_cleanup":"inactivewindow.googletag.cmd || []; // SID is used by the Moving Leads
浏览 1
提问于2017-05-08
得票数 5
回答已采纳
3
回答
在
浏览器(由
BeautifulSoup
生成)中直接
从
Python
启动
HTML
代码
、
、
、
我已经
使用
Python
3.3的
BeautifulSoup
成功地
从
网页中
提取
了所需的信息。我还
使用
了
BeautifulSoup
生成新的超文本标记
语言
代码来显示此信息。目前,我的
Python
程序打印出
HTML
代码,然后我必须复制、粘贴并另存为
HTML
文件,然后我可以
在
浏览器
中
测试它。所以我的问题是,有没有办法用
Python
语言
<em
浏览 2
提问于2014-01-30
得票数 26
回答已采纳
3
回答
用
BeautifulSoup
提取
<
script
>的内容
、
、
1/我试图用漂亮的汤
提取
脚本的一部分,但它什么也没有打印出来。出什么事了?videoId=341712453"soup =
BeautifulSoup
(oururl)
script
.extract() list_of_scripts = soup.findAll("
script
"
浏览 1
提问于2014-10-04
得票数 27
回答已采纳
1
回答
用
Python
抓取Web数据
、
、
、
我试图
从
rotogrinders.com
中
抓取数据,但我遇到了一些挑战。特别是,我希望能够
使用
这种格式的urls (显然可以更改其他日期的数据)来抓取以前的NHL游戏数据: 然而,当我到达页面时,我注意到数据被分解成了几个页面,我不知道如何获得脚本,以获得页面底部的"all有没有办法
在
蟒蛇身上做到这一点?也许是允许点击按钮的库?或者,
在
URL/请求方面,是否有什么方法可以
在
不实际单击按钮的情况下获得数据?
浏览 4
提问于2016-11-25
得票数 0
回答已采纳
2
回答
解析
HTML
源代码
中
的JavaScript代码
如何
使用
Python
解析
HTML
源
中
的JavaScript代码,例如,我想
提取
productList对象<
html
><div id="content-wrapper"--
html
content --> var productList = { "daaa"
浏览 0
提问于2014-11-25
得票数 2
1
回答
用
python
从
<
script
>内部的javascript var中
提取
数据
、
、
、
我对
python
、
BeautifulSoup
和其他方面都很熟悉,但我想
提取
json
数据,这些数据位于网站的"
script
“标记
中
的javascript变量
中
。这是我现在的代码:from bs4 import
BeautifulSoup
import requestspage = requests.get(url).content
浏览 2
提问于2017-11-27
得票数 5
回答已采纳
1
回答
不要用漂亮的汤刮网站数据
、
、
这是我第三次或第四次
使用
BeautifulSoup
。我
使用
它和requests一起从中刮取数据。我试图抓取运动员的姓名、年龄、身高等信息。然而,当我试图获取信息(打印(Player_name))时,我得到的是这个信息,而不是显示在网站页面
中
的信息:import requests def scr
浏览 1
提问于2021-08-26
得票数 1
回答已采纳
2
回答
正则表达式以匹配花括号
中
的文本
、
、
试图从下面的代码中
提取
第一个打开的和最后一个闭括号之间的文本:我尝试过
使用
._?
浏览 3
提问于2019-10-28
得票数 0
回答已采纳
3
回答
如何
从
html
页面中
提取
javascript,css和img
标签
的链接?
如何
从
html
页面中
提取
javascript,css和img
标签
的链接?我是否需要
使用
正则表达式,或者已经有一些轻量级的库用于
html
解析?
浏览 1
提问于2011-06-27
得票数 2
3
回答
从
HTML
脚本元素内部
提取
对象键的值
、
、
、
<div class="heading-dom view"> window.realty = {"user_id--window.agency = < %-
JSON
.stringify(agency) % >;--> <!--window.agency = < %-
JSON
.stringify({}) % &
浏览 5
提问于2017-12-15
得票数 2
回答已采纳
1
回答
为什么漂亮汤找不到我要找的
html
元素?
、
我正试图
从
coinbase
中
获取加密货币价格的变化,方法是用漂亮的汤进行解析。
在
coinbase网站()上,我可以找到价格变化的
html
元素。class="TextElement__Spacer-hxkcw5-0 caIgfs Header__StyledHeader-sc-1xiyexz-0 dLILyj">+0.33%</h4> 然后,
在
python
中
,我通过查看h4标记来
使用
漂亮的汤来查找这个元素,
浏览 1
提问于2020-06-14
得票数 2
回答已采纳
2
回答
为什么
BeautifulSoup
将<
html
><body><p>添加到我的结果
中
?
、
、
、
、
/
json
"><![CDATA[{ "name":"John", "age":31, "city":"New York"}]]></body></
html
>我编写了以下
Python
3.6代码: from bs4 impor
浏览 0
提问于2018-01-29
得票数 3
回答已采纳
7
回答
BeautifulSoup
解析的问题
、
我正在尝试用
BeautifulSoup
解析一个
html
页面,但是看起来
BeautifulSoup
根本不喜欢这个
html
或者那个页面。"--
HTML
------------------------------------------"print "--
BeautifulSoup
---------------------------------" print
BeautifulSoup
浏览 1
提问于2009-03-02
得票数 5
回答已采纳
1
回答
如何
使用
BeautifulSoup
查看闭合
标签
的总数?
、
下面的代码检查是否有一个以上的打开
html
标签
, <
html
> </
html
>""" soup =
BeautifulSoup
(invalid, '
html
.parser
浏览 0
提问于2014-03-02
得票数 1
点击加载更多
相关
资讯
如何使用Python和BeautifulSoup爬取网站
使用多个Python库开发网页爬虫(一)
python教程|如何批量从大量异构网站网页中获取其主要文本?
网页源码解析模块介绍及实战
Python实例:爬取网页中的一列数据
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券