微信掃碼 立即咨詢

不斷超越客戶的期望值,源自我們對這個行業(yè)的熱愛
來源:網(wǎng)絡(luò)推廣知識 - 遠策科技 | 2021-11-05
百度搜索蜘蛛也有假的?哪些蜘蛛是百度搜索的?如何才能正確識別百度蜘蛛呢?今天遠策科技簡單兩步,教你如何識別真假百度蜘蛛。
一、查看UA信息
如果UA信息不對,可以直接判斷該蜘蛛為非百度搜索的蜘蛛。
目前UA分為移動、PC、和小程序三個應(yīng)用場景,分別如下:
【移動UA】
Mozilla/5.0(Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko)Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)
Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)
【PC UA】
Mozilla/5.0(compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
Mozilla/5.0(compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)
【小程序UA】
Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;Smartapp; +http://www.baidu.com/search/spider.html)
二、雙向DNS解析認證
第一步:DNS反查IP
開發(fā)者可以對日志中訪問服務(wù)器的IP地址進行反向DNS查找,判斷某只spider是否來自百度搜索引擎,Baiduspider的hostname以*.baidu.com或*.baidu.jp 的格式命名,非*.baidu.com或*.baidu.jp即為冒充。
在Linux/Windows/OS三種平臺下,驗證方法分別如下:
1) 在Linux平臺下,可以使用host IP命令反解IP來判斷該抓取是否來自Baiduspider。
2) 在Windows平臺或者IBM OS/2平臺下,可以使用nslookup IP命令反解IP:打開命令處理器,輸入nslookup xxx.xxx.xxx.xxx(IP地址)就能解析IP,判斷該抓取是否來自Baiduspider。
3) 在macOS平臺下,可以使用dig命令反解IP:打開命令處理器輸入dig -x xxx.xxx.xxx.xxx(IP地址)就能解析IP,判斷該抓取是否來自Baiduspider。
第二步:對域名運行正向DNS查找
對第一步中通過命令檢索到的域名運行正向DNS查找,驗證該域名與日志中訪問服務(wù)器的原始IP地址是否一致,IP地址一致可確認spider來自百度搜索引擎,IP地址不一致即為冒充。
【示例】
> host 111.206.198.69
69.198.206.111. in-addr.arpa domain name pointer baiduspider-111-206-198-69.crawl.baidu.com.
>hostbaiduspider-111-206-198-69.crawl.baidu.com
baiduspider-111-206-198-69.crawl.baidu.com has address 111.206.198.69