通过IP反查(nslookup)判断百度蜘蛛IP真假

我们经常会碰到黑客利用伪装蜘蛛扫描网站,今天我们介绍下如何利用IP反查方法,判断蜘蛛是否为百度搜索引擎蜘蛛。

以百度为例,通常我们判断是否是百度蜘蛛抓取看用户代理字符串也就是User-Agent,但是User-Agent是可以模拟的,所以很多时候也会有虚假的模拟伪装成百度蜘蛛来抓取,这时候我们就需要学会分辨真伪。

通过IP反查(nslookup)判断百度蜘蛛IP真假

首先是百度User-Agent代理字符串,百度官方公布的有如下User-Agent:

移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

新增渲染UA:

移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

需要注意的是百度新增了一个移动的User-Agent,和一个PC的User-Agent。我们知道了百度蜘蛛的User-Agent,如何正确识别和判断某条抓取是否是真实的百度蜘蛛。

如何识别百度蜘蛛

1、首选我们需要通过关键词找User-Agent中是否包含Baiduspider;

2、如果想区分移动和PC的蜘蛛的话,我们还需要在结果中再进行关键词过滤,移动端的User-Agent包含:Android 、iPhone、Mobile等三个中至少一个。

3、通过上述操作我们可以分辨出哪些抓取是百度蜘蛛抓取,但并不能分辨真伪。

判断百度蜘蛛真伪

1、验证百度蜘蛛真伪我们一般使用的是DNS反查IP的方式来进行判断,首选我们需要找到上述抓取记录中蜘蛛的IP。

通过IP反查(nslookup)判断百度蜘蛛IP真假

通过IP反查(nslookup)判断百度蜘蛛IP真假

2、以windows操作系统为例,开始运行中输入cmd 弹出窗口中输入 nslookup (上述IP地址),判断百度蜘蛛的真伪,真是百度蜘蛛结果中会返回以*.baidu.com 或*.baidu.jp 的格式命名hostname,如不包含则为假百度蜘蛛。

常见HTTP状态码解读:

1、200代码,表示蜘蛛爬取正常

2、404代码,访问的这个链接是错误链接

3、301代码,永久重定向

4、302代码,表示临时重定向

5、304代码,客户端已经执行了GET,但文件未变化。

6、500代码,表示网站内部程序或服务器有错

主题测试文章,只做测试使用。发布者:佰搜SEM,转转请注明出处:https://www.geoaiseo.com/8595.html

(0)
佰搜SEM佰搜SEM
上一篇 2024年12月11日 上午11:41
下一篇 2024年12月11日 上午11:41

相关推荐

  • 自助建站模板如何选择?

    摘要 很多站长在进行建站时,都会选择智能建站系统,这样建站比较快速,成本也相对比较低。那么,自助建站模板如何选择?接下来小编就跟大家分享下自助建站模板选择技巧,一起来看看吧!1.基础参数网站的基础参数包括空间、流量、文章数及页面数, 很多站长在进行建站时,都会选择智能建站系统,这样建站比较快速,成本也相对比较低。那么,自助建站模板如何选择?接下来小编就跟大家…

    SEO优化 2022年5月7日
    00
  • 网站收录情况如何填写,全面解析SEO优化关键步骤

    随着互联网的飞速发展,网站已成为企业展示形象、拓展市场、提高品牌知名度的重要渠道,而网站收录情况则是衡量网站质量、优化效果的重要指标,如何填写网站收录情况呢?本文将从以下几个方面为您详细解析。 了解网站收录情况 网站收录情况是指搜索引擎抓取并收录网站页面数量的情况,网站收录情况包括以下三个方面: 1、网站总收录量:指搜索引擎收录网站页面的总数。 2、网站首页…

    2025年5月8日
    00
  • 视频网站收录的电视,新时代媒体融合的典范

    随着互联网技术的飞速发展,视频网站已成为人们获取信息、娱乐休闲的重要渠道,在众多视频网站中,收录了大量的电视节目,为观众提供了丰富多彩的视听体验,本文将探讨视频网站收录的电视节目,分析其优势与挑战,并展望其未来发展。 视频网站收录的电视节目优势 丰富多样 视频网站收录的电视节目涵盖了新闻、综艺、电视剧、电影、纪录片等多个领域,满足了不同观众的需求,观众可以随…

    2025年5月29日
    00
  • 织梦CMS、帝国CMS、wordpress哪个更适合新手建站?

    摘要 从技术层面来讲,CMS系统是一座连接起网站前端页面和后台管理的桥梁。通过CMS建站系统,在网站后台就可以管理前台的很大一部分内容,用起来也非常方便。通过CMS建站不仅可以让你的网站更加规范、系统,而且cms也在很大程度上降低网站的制作难度,让一个哪怕是不懂程序的人,也可以轻松搭建完整甚至强悍的网站。国内常用的PHP开源CMS系统有:PHPCMS、织梦D…

    SEO优化 2022年5月7日
    00
  • 朋友最近想学sem,sem到底做是什么的?

    Search Engine Marketing (SEM)搜索引擎营销-概述 搜索引擎营销(SEM)是一种使用出现在搜索引擎结果页面(或SERPs)的付费广告来营销业务的实践。广告商对百度/谷歌和必应等服务的用户在搜索特定产品或服务时可能输入的关键字进行竞价,这样广告商就有机会让他们的广告与这些搜索查询的结果一起出现。 这些广告通常被称为“点击付费广告”(p…

    SEO优化 2024年6月14日
    00

联系我们

在线咨询: QQ交谈

邮件:3413323304@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
网站+域名可转让!