要禁止爬虫访问您的PHP网站,您可以通过以下几种方法来实现:
.htaccess
文件:在您的网站根目录下创建或编辑.htaccess
文件,添加以下代码:<IfModule mod_rewrite.c>
RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} (googlebot|bingbot|baiduspider|yandex|yahoo|slurp) [NC]
RewriteRule ^.*$ - [R=403,L]
</IfModule>
这段代码会检测到常见的搜索引擎爬虫(如谷歌、必应、百度等),并返回403禁止访问的状态码。
$user_agent = $_SERVER['HTTP_USER_AGENT'];
$bots = array('googlebot', 'bingbot', 'baiduspider', 'yandex', 'yahoo', 'slurp');
foreach ($bots as $bot) {
if (stripos($user_agent, $bot) !== false) {
header('HTTP/1.0 403 Forbidden');
echo '禁止爬虫访问';
exit();
}
}
这段代码会检测到访问者的User-Agent,如果匹配到常见的爬虫,将返回403禁止访问的状态码。
例如,您可以设置一个规则,禁止User-Agent包含“googlebot”、“bingbot”等关键词的访问请求。这样,当爬虫尝试访问您的网站时,CDN节点会拦截并返回403禁止访问的状态码。
请注意,这些方法并不能完全阻止所有爬虫,因为爬虫可能会使用不同的User-Agent或者绕过这些限制。但它们可以有效地阻止大多数常见的爬虫。为了更好地保护您的网站,建议您结合多种方法并定期更新防爬虫策略。