Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >2021常见的搜索引擎蜘蛛的User Agent汇总

2021常见的搜索引擎蜘蛛的User Agent汇总

原创
作者头像
小唐同学.
发布于 2022-03-10 03:15:30
发布于 2022-03-10 03:15:30
3.6K00
代码可运行
举报
文章被收录于专栏:CMS建站教程CMS建站教程
运行总次数:0
代码可运行

名词解释

Spider

Spider、蜘蛛、爬虫均为一个意思,一般是人为设计好的,用来收集信息。

User-Agent

User-Agent简称UA,一般代表了用户使用的设备、系统、浏览器、环境等信息,当然Spider也有专门的UA。

使用场景

安全专业人士

一般安全专业人士会巧用UA来绕过防火墙、安全设备的UA检测 构造特定的UA来访问一些其他UA无法访问的页面。 构造UA通过僵尸网络完成DDOS攻击,对服务器进行压力测试或者评估。

程序开发者

当然,程序猿也需要使用到UA,比方说通过判断UA来设计兼容不同设备访问的界面。再比方说,在设计爬虫脚本的时候也需要不断变化UA防止被网站检测到恶意行为。

百度Spider

百度最新UAPC

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Mozilla/5.0 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

移动

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

百度使用最多UA

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

百度图片

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Baiduspider-image+(+http://www.baidu.com/search/spider.htm)

360Spider UA

360搜索

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0);

360网站安全检测

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
360spider (http://webscan.360.cn)

Google Spider UA

Google

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

Google图片搜索

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Googlebot-Image/1.0

Adwords移动网络

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“AdsBot-Google-Mobile (+http://www.google.com/mobile/adsbot.html) Mozilla (iPhone; U; CPU iPhone OS 3 0 like Mac OS X) AppleWebKit (KHTML, like Gecko) Mobile Safari”

微软 Spider UA

必应

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)

腾讯搜搜Spider UA

搜搜

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Sosospider+(+http://help.soso.com/webspider.htm)

搜搜图片

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Sosoimagespider+(+http://help.soso.com/soso-image-spider.htm)

雅虎 Spider UA

雅虎英文

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)

雅虎中国

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)”
Sogou Spider UA

搜狗图片

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“http://pic.sogou.com” “Sogou Pic Spider/3.0(+http://www.sogou.com/docs/help/webmasters.htm#07)

搜狗

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)

网易有道 UA

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Mozilla/5.0 (compatible; YoudaoBot/1.0; http://www.youdao.com/help/webmaster/spider/; )

比较小众的一些Spider UA

宜搜 EasouSpider

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Mozilla/5.0 (compatible; EasouSpider; +http://www.easou.com/search/spider.html)

华为赛门铁克蜘蛛

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“HuaweiSymantecSpider/1.0+DSE-support@huaweisymantec.com+(compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR ; 
http://www.huaweisymantec.com/cn/IRL/spider)

七牛镜像蜘蛛

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
qiniu-imgstg-spider-1.0

监控宝

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; JianKongBao Monitor 1.1)

DNSPod监控

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
DNSPod-Monitor/2.0

国外一些Spider的UA

瑞典 Speedy Spider

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) Speedy Spider (http://www.entireweb.com/about/search_tech/speedy_spider/)

俄罗斯 yandex

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Mozilla/5.0 (compatible; YandexBot/3.0; +http://yandex.com/bots)

俄罗斯 LinkpadBot

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Mozilla/5.0 (compatible; LinkpadBot/1.06; +http://www.linkpad.ru)

英国 MJ12bot

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
“Mozilla/5.0 (compatible; MJ12bot/v1.4.0; http://www.majestic12.co.uk/bot.php?+)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
2019年搜索引擎蜘蛛爬虫名称最新整理总汇
一般我们的网站能在百度等搜索引擎上搜到,说明该搜索引擎的爬虫爬到了我们的网站并且被搜索引擎收录。
德顺
2019/11/13
6.1K0
2019年搜索引擎蜘蛛爬虫名称最新整理总汇
常用User Agent整理
采集什么的喜欢这个了。 OLD N97 Mozilla/5.0 (SymbianOS/9.4; Series60/5.0 NokiaN97-1/20.0.019; Profile/MIDP-2.1 Configuration/CLDC-1.1) AppleWebKit/525 (KHTML, like Gecko) BrowserNG/7.1.18124 BlackBerry - Playbook 2.1 Mozilla/5.0 (PlayBook; U; RIM Tablet OS 2.1.0; en-U
老高的技术博客
2022/12/27
8140
百度蜘蛛的 User Agent
移动UA: Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html) PC UA: Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.bai
Denis
2023/04/15
4380
如何通过 User-Agent 识别百度蜘蛛
如果有大量的百度蜘蛛抓取网站就需要注意了:有可能是其他爬虫伪造百度蜘蛛恶意抓取网站。
太后
2021/10/12
2K0
如何通过 User-Agent 识别百度蜘蛛
PHP判断来访者是否是搜索引擎的爬虫
我们可以通过HTTP_USER_AGENT来判断是否是蜘蛛,搜索引擎的蜘蛛都有自己的独特标志,下面列取了一部分。
程序猿的栖息地
2022/04/29
7540
最全网站日志分析攻略,全面解析百度蜘蛛!
大家进行网站日志分析的时候,常见到很多不同IP段的百度蜘蛛,为了方便大家更好的进行日志分析,下面列举了百度不同IP段常见蜘蛛的一些详情情况,及所谓的降权蜘蛛,沙盒蜘蛛,高权重蜘蛛等等。
用户9229846
2021/12/08
3.7K0
最全网站日志分析攻略,全面解析百度蜘蛛!
如何辨别真伪百度蜘蛛Baiduspider
我们在根据网站日志分析搜索引擎蜘蛛抓取网页的记录时,实际上很多站点都是有一些伪装称baiduspider的到访者的。这些数据会严重影响我们对日志分析后的判断。
晨曦云
2021/11/25
1.5K0
Robots.txt – 禁止爬虫
robots.txt用于禁止网络爬虫访问网站指定目录。robots.txt的格式采用面向行的语法:空行、注释行(以#打头)、规则行。规则行的格式为:Field: value。常见的规则行:User-Agent、Disallow、Allow行。
全栈程序员站长
2022/07/07
2.2K0
get,post请求实例
/** * Describe:Curl post函数 * @param $url * @param array $data * @param bool $isPost * @param int $coding * @param bool $isForge * @return bool|string * Created by zhangzq at 2021/4/26 17:22 */ function curlPost($url, $data = array(), $isPost =
OwenZhang
2021/12/08
1.1K0
get,post请求实例
尝试百度Spider抓取异常问题
介于网络环境不同,很多人有需求在保留国内域名 DNS 服务器不改变的情况下,还能接入国外服务商比如 CloudFl...
吴蛋蛋
2023/03/14
1.3K1
尝试百度Spider抓取异常问题
服务器屏蔽爬虫的方案
进服务器后进入这个路径 nginx/conf 新建一个文件,文件名可以为:agent_deny.conf 复制以下代码到此文件:
学派客
2023/04/06
1.6K1
php记录搜索引擎爬行记录的实现代码
//记录搜索引擎爬行记录 $searchbot = get_naps_bot();
用户8832582
2021/07/13
5660
服务器反爬虫攻略:Apache/Nginx/PHP禁止某些User Agent抓取网站
我们都知道网络上的爬虫非常多,有对网站收录有益的,比如百度蜘蛛(Baiduspider),也有不但不遵守 robots 规则对服务器造成压力,还不能为网站带来流量的无用爬虫,比如宜搜蜘蛛(YisouSpider)(最新补充:宜搜蜘蛛已被 UC 神马搜索收购!所以本文已去掉宜搜蜘蛛的禁封!==>相关文章)。最近张戈发现 nginx 日志中出现了好多宜搜等垃圾的抓取记录,于是整理收集了网络上各种禁止垃圾蜘蛛爬站的方法,在给自己网做设置的同时,也给各位站长提供参考。 一、Apache ①、通过修改 .htacce
张戈
2018/03/23
2.5K0
利用nginx来屏蔽指定的user_agent的访问以及根据user_agent做跳转
对于做国内站的我来说,我不希望国外蜘蛛来访问我的网站,特别是个别垃圾蜘蛛,它们访问特别频繁。这些垃圾流量多了之后,严重浪费服务器的带宽和资源。通过判断user agent,在nginx中禁用这些蜘蛛可以节省一些流量,也可以防止一些恶意的访问。
用户1349575
2022/02/22
6.2K0
利用Nginx反向代理来简单镜像HTTP(S)网站的方法
然后访问你的域名看一看是否成功镜像,需要注意的一点是,如果被镜像的网站设置了防盗链,那么静态文件(js/css/图片)可能无法显示,这就没办法了。
用户4988085
2021/09/17
8.1K0
全站启用SSL之后,如何兼容不支持https抓取的搜索引擎?
还是在今年 5 月份,百度就跳出来,宣布成为国内首个支持 https 的搜索引擎,结果呢?呵呵... 一、案例 ①、抓取诊断 全站开启并强制 https 之后,在百度站长平台使用抓取诊断发现,其实百度
张戈
2018/03/21
2.1K0
全站启用SSL之后,如何兼容不支持https抓取的搜索引擎?
[技术向] 用Docker自建 Vaultwarden (Bitwarden_rs)
Bitwarden是一个免费、自由且开源的的密码管理器,服务端也完全开源,可以自己搭建。 本文将咱自建bitwarden的过程记录下来。
Nyarime
2021/12/14
13.1K3
[技术向] 用Docker自建 Vaultwarden (Bitwarden_rs)
Python爬取哔哩哔哩(bilibili)视频
本篇文章主要给大家讲解下如实使用python 爬取哔哩哔哩中的视频,首先我是一名大数据开发工程师,爬虫只是我的一个业余爱好,喜欢爬虫的小伙伴可以一起交流。好了多了就不多说了喜欢的朋有可以收藏,转发请复原文链接谢谢。
大数据老哥
2021/02/04
2.8K1
Python爬取哔哩哔哩(bilibili)视频
awk命令整理
format是字符串,包含要逐字打印的文本,穿插着format之后的每个值该如何打印的规格(specification),一个规格是一个%符,后面跟着一些字符,用来控制一个value的格式。
dogfei
2020/07/31
8840
Docker部署Vaultwarden(Bitwarden_RS)
最近又有超星学习通的数据库被脱裤的消息,涉及了1.6亿条个人信息,又是一次密码大泄露,所以我也开始考虑使用密码管理器了。
SakuraRain
2022/06/22
3.4K0
相关推荐
2019年搜索引擎蜘蛛爬虫名称最新整理总汇
更多 >
LV.5
腾讯云TDP先锋会员
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验