首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >网站总是使用过时的浏览器来标记它

网站总是使用过时的浏览器来标记它
EN

Stack Overflow用户
提问于 2019-02-17 22:12:21
回答 1查看 514关注 0票数 0

我正在尝试抓取网站的https://anichart.net/,以便使用这些信息来建立一个时间表。问题是该站点总是检测到过时的浏览器(显示http://outdatedbrowser.com)。

代码语言:javascript
运行
AI代码解释
复制
    <div class=noscript>We\'re sorry but AniChart requires Javascript. 
    <br>Please enable Javascript or <a 
    href=http://outdatedbrowser.com>upgrade to a modern web browser</a>. 
    </div></noscript><div class="noscript modern-browser" style="display: 
    none">Sorry, AniChart requires a modern browser.<br>Please <a 
    href=http://outdatedbrowser.com>upgrade to a newer web browser</a>.</div>

我尝试了一个常规请求,也尝试了强制用户代理,如下所示。

代码语言:javascript
运行
AI代码解释
复制
    import requests

    self.url = 'https://anichart.net/Winter-2019'

    headers = {'User-agent': 'Chrome/72.0.3626.109'}

    self.page = requests.get(self.url, headers=headers)

    print(self.page.content)

我知道该站点使用的是javascript,请求模块不会引用该站点的javascript生成部分,除非我使用其他工具或潜在的Selenium。我的浏览器是最新的,所以这不应该返回过时的浏览器结果。

这在几天前还工作得很好,但看起来他们只是更新了他们的网站,所以他们可能添加了一些阻止网站自动请求的东西。

编辑:

Selenium代码如下:

代码语言:javascript
运行
AI代码解释
复制
    from selenium import webdriver

    url = 'https://anichart.net/Winter-2019'

    website = webdriver.Chrome()

    website.get(url)

    print(website.page_source)

    html_after_JS = website.execute_script("return document.body.innerHTML")

    print(html_after_JS)
EN

回答 1

Stack Overflow用户

发布于 2019-02-17 22:18:09

问题不在于浏览器检测。

requests只是简单地呈现JavaScript (您似乎已经知道了),而且现在大多数网站都使用前端Javascript库来呈现内容。还有一些网站使用Javascript检测来防止机器人抓取页面……

相反,您将需要使用Selenium这样的工具,它将打开一个您选择的无头的“现代”浏览器,您可以从那里抓取页面。但是您还没有展示这些代码,所以问一下这个问题可能更有意义?

或者,更好的是,他们有一个API - https://github.com/AniList/ApiV2-GraphQL-Docs

AniList & AniChart网站本身在Api上运行,所以你可以在这些网站上做的所有事情,都可以通过Api来完成。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54738176

复制
相关文章
使用自定义标记来构建页面
在用html5来搭建页面的时候,为了兼容不支持html5标记的浏览器,需要把html5标记全部createElement一遍。
练小习
2018/01/15
1.4K1
dotnet 使用 Obsolete 特性标记成员过时保持库和框架的兼容性
在开发库以及框架的时候,持续维护会遇到兼容性的问题,如发现了旧版本有一些接口设计不合理,或者方法命名不符合逻辑等。此时如果直接更改原有的属性名或方法名甚至类名等,将会导致上层业务的开发者们在升级库之后构建不通过,因为缺少对应的方法。此时就需要上层业务的开发者们查阅文档才能了解如何应对升级之后带来的变动
林德熙
2020/11/19
6130
成为GPT-3的甲方,让它来帮你设计网站
一位来自旧金山的程序员小哥做了款名为debuild.co的网页制作软件,只需要和GPT-3“聊聊天”,它就能帮你把网站设计出来。
量子位
2020/09/14
8110
成为GPT-3的甲方,让它来帮你设计网站
边缘计算:需要改变什么来增加它的使用
到目前为止,您可能已经听说过边缘计算——即靠近最终用户的网络“边缘”部署数据或应用程序——以及它提供的优于传统云计算的好处。
CloudBest
2023/03/03
4120
边缘计算:需要改变什么来增加它的使用
用箭头和文字来标记重要的点
为了更好的看出文字和坐标的关系,我在图中添加了水平和垂直方向的辅助线, 可以看到,文字的左下角对应的是我们提供的坐标,这个和R语言中默认的文字中心为点的坐标不一样。
生信修炼手册
2020/08/28
2K0
【亲测】使用宝塔网站加速插件来加速网站速度,优化网站
原理是:在http协议层,对动态页面进行缓存,对需要实时信息及已登录的会话跳出缓存,此技术主要针对匿名访问的用户进行加速响应,以减少应用服务器和数据库的开销。
雾海梦曦
2022/11/12
6.7K0
【亲测】使用宝塔网站加速插件来加速网站速度,优化网站
视频文件太大?使用FFmpeg来无损压缩它!
咱们平时如果经常拍视频的话,都会遇到一个困境:视频文件太大了,存储的时候需要占用很多的空间。如果直接使用视频压缩工具来压缩码率的话,又会担心损失了视频的画质,这该怎么办呢?
灯珑LoGin
2022/10/31
5.9K0
视频文件太大?使用FFmpeg来无损压缩它!
网站总是被黑客篡改怎么办
网站被篡改到底有多严重,我们公司网站前段时间被人入侵,并且篡改了我们的代码,导致我们网站所有的页面都变成BC广告,导致现在页面持是不收录,每天编辑都在更新文章,结果还是停歇到前段时间被黑的那种页面,如果我们的网站迟迟没发现被篡改的话,甚至不会处理或者再次被反复篡改的话,那么就有可能导致蜘蛛再来抓取我们的网站页面的时候,还是这种非正规行业,从而多次出现这种情况,就会给我们网站进行进行降权,并且k站,我们该如何防御这种被篡改的方式的能够入侵到我们网站,获取到了我们的权限,才会出现这种情况。
技术分享达人
2022/04/20
1.5K0
网站总是被黑客篡改怎么办
网站数据总是被盗取怎么办
最近,我们公司的在线业务系统遇到了一个更为棘手的问题。该公司的网站在线商城系统遭到黑客的入侵,数据库中的用户数据被黑客盗取。由于大部分的客户信息的泄露,公司接到了客户投诉说是电话经常被骚扰,以及受到广告短信。由于缺乏专业的安全技术没有安全方面的经验,PHP系统仅限于功能的实现。看来我需要学习安全方面的一些防止SQL注入攻击的,所以我必须下定决心,努力学习网站的安全。通过不断的探索,我找到了一个比较好的PHP安全方面的书籍“PHP安全之路”。在阅读的过程中,我会把学到的东西记下来,以便将来可以进行学习回忆。
技术分享达人
2022/02/11
9280
Django 使用中间件来控制网站的关闭
新建一个html文件,名字为close.html,用来给用户一个提示,网站已经关闭,请稍后访问!
KEVINGUO_CN
2020/03/17
6720
使用AUCell结合单细胞亚群标记基因列表来判断亚群名字
是比较自动化的AUCell包的算法 ,很多小伙伴后台提问说具体该如何操作呢,代码层面是否有分享,毕竟我们仅仅是在 :这近100种单细胞亚群的2348个标记基因好用吗,截图了文章里面的method描述而已。
生信技能树
2023/09/04
7020
使用AUCell结合单细胞亚群标记基因列表来判断亚群名字
逻辑-Flutter专栏-它来咯!!!
Flutter 相信大家已经不再陌生了! 在 2018-2020 无论从实际开发到面试,Flutter已经走入移动开发 (Android / iOS),本人针对 Flutter 的表现,真心觉得 Flutter 有必要真正掌握。
CC老师
2021/01/06
6010
逻辑-Flutter专栏-它来咯!!!
Sshwifty ,使用你的浏览器来连接服务器
huolong
2023/08/21
9080
Sshwifty ,使用你的浏览器来连接服务器
Prometheus Relabeling 重新标记的使用
Relabeling 重新标记是配置 Prometheus 元信息的方式,它是转换和过滤 Prometheus 中 label 标签对象的核心,本文我们将了解 Relabeling 规则的工作原理以及在不同场景中的应用方式。
我是阳明
2021/10/08
5.4K0
为什么网站收录不稳定,总是浮动?
我们知道网站收录的页面越多,可以参与排名的页面也就越多,对于提升网站权重起到关键的作用。所以网站站长都十分在意网站的收录量,如果网站的收录量波动幅度比较大,或收录量骤降,就应该提高警惕,分析到底是哪里出了问题。
蝙蝠侠IT
2021/06/23
6010
为什么网站收录不稳定,总是浮动?
QQ里提示使用浏览器打开网站
在b2child下新建一个php文件夹,新建一个qq.php文件 把代码复制进去保存即可.或者把下面的附件上传到里面解压.可到一个qq.php
小狐狸说事
2022/11/17
2.6K0
QQ里提示使用浏览器打开网站
使用 OpenCV 的基于标记的增强现实
了解什么是增强现实 (AR)、虚拟现实 (VR) 和混合现实 (MR),Marker-based AR 和 Marker-less AR 之间的区别:https://arshren.medium.com/all-you-want-to-know-about-augmented-reality-1d5a8cd08977
小白学视觉
2022/12/27
1.5K0
使用 OpenCV 的基于标记的增强现实
浏览器做打假助手,它的边界在哪里?
原创2015-03-15罗超 315即将到来,搜狗浏览器推出“打假助手插件”,这是一个在以天猫淘宝为主的电商网站中,插入购物提示信息的网购辅助功能。浏览器对电商商品页面进行内容提示,看上去它正在充当裁判角色,它的边界究竟在哪里? 浏览器打假助手初心:保障网购安全 315即将来临,各家企业如履薄冰,生怕自己成为众矢之的。过去一年屡有电商、旅游等企业的侵权事件发生,这不免让人担心,今年会不会有互联网企业上榜?“互联网+”的大环境下,互联网正在影响人们生活的方方面面,现实生活中曾遇到的问题在互联网上都在不断出现,
罗超频道
2018/04/28
4K0
浏览器做打假助手,它的边界在哪里?
pkl是什么类型的文件?怎么来打开它?
一说pkl很容易想到王者荣耀的kpl比赛,哈哈! pkl格式的文件是python用于保存文件用的。
小蓝枣
2020/09/25
14.3K0
pkl是什么类型的文件?怎么来打开它?
点击加载更多

相似问题

rsync‘’ed输出总是被标记为过时

14

标记为过时

211

VC++项目总是过时

10

在html中,我应该使用什么标记来代替过时的标记字体(不能使用CSS)

42

Dojo Datagrid总是显示过时的数据

10
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档