首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Python爬虫之无法获取网页源码的解决方案详解

Python爬虫之无法获取网页源码的解决方案详解

作者头像
荣仔_最靓的仔
发布2022-01-10 13:48:34
发布2022-01-10 13:48:34
3.1K0
举报

目录

1 引子

2 解决方案

1 引子

对某网页数据爬取时,

键中

显示网页源码与鼠标右键

查看网页源代码显示的网页源码不同。

图1: F12 键中 Elements 显示的网页源码

图2:鼠标右键 -> 查看网页源代码显示的网页源码

因此,在使用如下代码获取网页源码时实际上获取的是图

所示的网页源码:

代码语言:javascript
复制
content = requests.get(url).content.decode('utf-8')
print(content)

然而我们想要获得是图

所示的网页源码,那么这个想法怎么实现呢?

2 解决方案

既然无法通过

库来直接获取到我们想要的网页源码,那么我们就采用

方法直接获取我们想要的网页源码。

基于此,直接右击鼠标找到

,复制可供复制的整篇源码。

粘贴到本地,并将文件以

后缀命名。

之后就好办了,比如我这里运用

库即可获取到我们想获得的网页源码。

代码语言:javascript
复制
soup = BeautifulSoup(open('new.html', encoding='utf-8'), "html.parser")
print(soup)
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021/11/19 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1 引子
  • 2 解决方案
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档