SEO网站的特别是Wordpress建站,有了排名也有流量后,就会发现网站的RPS(每秒钟请求数)会非常多,而实际访客却不怎么多。这些异常现象,福州华诺技术Peter认为,要不要引起重视呢?
有人说,得高度重视,只要保留实际访客即可;有人说,不需要重视,反正网站能正常运行。说实在话,福州华诺技术Peter刚开始,也不重视的。当服务器一次又一次的宕机,我觉得已是非常严重的事。通过这几天努力,查到单个IP在24小时内约是21K请求数量,换成分钟就是14.5次请求数每分钟,换成秒就是约4.13秒会请求一次。这个仅是平均值,最高峰时达到550请求数每秒。
最为头疼的事,是如何解决这种类似“打不死的小强”?福州华诺技术Peter虽以前有写过使用CloudFlare进行拦截教程。这里说一下,这种方法还是非常有效的。
但那种办法是治标不治本,换个IP,这种“打不死的小强”蜘蛛,又会重来。网站的服务器又会被迫停机。
特别是做我们SEO排名运营的,福州华诺技术Peter认为有必要从根本上解决,但这种是需要要时间和精力的。
第一步:从服务器后台或日志或安全软件等,找到那种“打不死的小强”蜘蛛和精确IP。这种排查,不管用什么办法,就是得查出来。
比如,福州华诺技术Peter,因空间外包给第三方,查IP时,不是非常方便。后来,就迁移到公司的服务器的,想看哪个日志,想看什么时间的日志,随时可以调取。这些具体分析过程,福州华诺技术Peter改日再写个详细教程。
经多次排查,IP 136.243.228.195 最为可疑,然后通过本机 host+IP 反查这个IP是什么蜘蛛,方便与User Agent匹配,是否两者为同一个蜘蛛。
root@fancy-beeps-1:~# host 136.243.228.195
195.228.243.136.in-addr.arpa domain name pointer crawling-gateway-136-243-228-195.dataforseo.com.
很明显,是指向了 dataforseo.com 。
第二步:打开DataForSEO 的官网, https://dataforseo.com/dataforseo-bot
福州华诺技术Peter马上在页面进行留言,相关的格式 可以参考我下面的范文:
同时,向DataForSEO的邮箱进行发信,内容也一致:
第三步:在网站/robots.txt 增加禁止那位“打不死的小强”蜘蛛:
# DataForSEO Bot
User-agent: DataForSeoBot
Disallow: /
上述的一定使用 Disallow: / 反斜杠,一定要加的。 DataForSeoBot 名称 正常是不区分大小的。
第四步:等待回复和数据变化。几分钟后,收到蜘蛛运营商的回复:
数据也发生了变化,至发稿为止,已有非常明显的变化:
第五步:把这个蜘蛛相关的IP全部禁止访问服务器或网站:
136.243.220.208/29
136.243.228.176/29
136.243.228.192/29
IPv6:
2a01:4f8:271:6283::/64
2a01:4f8:271:6284::/64
2a01:4f8:271:6285::/64
有时候假想一下,要是那些“打不死的小强”蜘蛛,都是谷歌或必应的蜘蛛该有多好啊!我都非常愿意加钱扩内存扩流量等让服务器升级;也不必浪费那么多的精力。
领取专属 10元无门槛券
私享最新 技术干货