菜鸡源码,专注精品下载!
当前位置:首页 > 建站教程 > 建站知识

WordPress阻止SemrushBot爬虫访问网站

发布时间:2024-01-05  栏目:建站知识   浏览:   分类:wordpress教程

WordPress禁止SemrushBot蜘蛛爬取网站的方法如下: 1. 登录WordPress后台,进入“设置”菜单。 2. 在“设置”菜单中,找到“讨论”选项,点击进入。 3. 在“讨论”设置页面中,找到“搜索引擎可见性”选项,将其设置为“不可见”。 4. 保存更改后,SemrushBot蜘蛛将无法访问您的网站内容。

用WordPress做了一个搜索记录功能,用于搜集用户的喜好,结果作者发现经常有莫名其妙的搜索记录,每天大概有1000多次的搜索量,WordPress自带的搜索非常耗资源,打开网站日志发现,发现很来自国外的垃圾营销蜘蛛SemrushBot的搜索,在宝塔防火墙中屏蔽IP也无效,网上找了一下,现成的代码:

#禁止垃圾蜘蛛抓取if($http_user_agent~*(SemrushBot|python|Linespider|crawler|DingTalkBot|simplecrawler|ZoominfoBot|zoombot|Neevabot|coccocbot|Facebot|YandexBot|Adsbot|DotBot|Applebot|DataForSeoBot|MJ12bot|BLEXBot|trendictionbot0|trendictionbot|AhrefsBot|hubspot|opensiteexplorer|leiki|webmeup)){return444;}

以宝塔为例,将上代码加到站点配置文件,最后一个”}“前面,当这些垃圾蜘蛛访问网站,只能得到444 没有任何数据。

再加个当链接中包含/search/重定向到其它页面。

代码添加到主题函数模板中:

//当URL包含/search/重定向add_action('template_redirect','custom_search_redirect');functioncustom_search_redirect(){//获取当前请求的URL$request_url=$_SERVER['REQUEST_URI'];//检查当前URL是否包含/search/if(strpos($request_url,'/search/')!==false){//如果是,则进行重定向到其他页面wp_redirect('https://www.baidu.com/');//wp_redirect(home_url('/new-page/'),301);exit();}}

作者说观察一段再说吧,估计还是不能完全拦截。


评论
建站知识
建站知识
使用技巧
调试安装
运营推广