Eswlnk Blog Eswlnk Blog
  • 资源
    • 精彩视频
    • 破解专区
      • WHMCS
      • WordPress主题
      • WordPress插件
    • 其他分享
    • 极惠VPS
    • PDF资源
  • 关于我
    • 论文阅读
    • 关于本站
    • 通知
    • 左邻右舍
    • 玩物志趣
    • 日志
    • 专题
  • 热议话题
    • 游戏资讯
  • 红黑
    • 渗透分析
    • 攻防对抗
    • 代码发布
  • 自主研发
    • 知识库
    • 插件
      • ToolBox
      • HotSpot AI 热点创作
    • 区块
    • 快乐屋
    • 卡密
  • 乱步
    • 文章榜单
    • 热门标签
  • 问答中心反馈
  • 注册
  • 登录
首页 › 攻防对抗 › 关于蜘蛛爬虫名为webprosbot的简单分析

关于蜘蛛爬虫名为webprosbot的简单分析

Eswlnk的头像
Eswlnk
2022-03-28 17:54:34
关于蜘蛛爬虫名为webprosbot的简单分析-Eswlnk Blog
智能摘要 AI
作者在其站点访问日志中发现名为“webprosbot”的UA代理,经过多轮搜索引擎查询,最终确认该爬虫来自亚马逊云。该爬虫自2021年9月起开始活动,主要爬取网站资源用于竞争分析和SEO监控。作者通过溯源分析发现,“webprosbot”隶属于WebPros公司,一家提供服务器管理和在线营销解决方案的SaaS平台。结合其行为模式,推测亚马逊云可能有意涉足搜索引擎领域,以进一步扩展其业务范围。

近日,在我对站点的访问日志中发现了名为webprosbot的UA代理。为了验证该爬虫的真实性,我首先在百度上检索了相关内容,结果查无所获。抱着好奇心,我对该爬虫的行为进行了分析。请各位看官,接着往下看.

关于蜘蛛爬虫名为webprosbot的简单分析-Eswlnk Blog

各大引擎搜索

首先,我在百度上搜素了关于webprosbot的UA信息,结果一无所获,没有一点有用的信息,为了求证,我在其他搜索引擎上搜索了该爬虫,包括bing、谷歌等。终于让我找到了这个爬虫的相关信息。

UAwebprosbot/2.​​0 (abuse-6337@webpros.com)
第一次见到2021-09-14 19:26:47
最后一次露面2022-03-21 22:51:08
IP 地址3.250.237.106(…)
DNSec2-3-250-237-106.eu-west-1.compute.amazonaws.com

该蜘蛛来源于亚马逊云科技,并且会对站内资源进行爬取,例如爬取本站以下内容:

关于蜘蛛爬虫名为webprosbot的简单分析-Eswlnk Blog

通过对该IP地址进行NSlookup反查,我确认了该IP和此爬虫来自亚马逊云,至于为何要爬取,大多数都是为了方便竞争网站的分析。

关于蜘蛛爬虫名为webprosbot的简单分析-Eswlnk Blog

溯源分析

为了找寻是谁编写了这个爬虫,我尝试在各大引擎上搜索了关于webpros的信息,而这一部分是百度搜索引擎所缺失的部分,至少在百度看来没有人对该爬虫信息分析和查证过。

功夫不负有心人,我找到了该爬虫的官网,Global SaaS platform for server management,以下内容来自官网的介绍:

适合所有人的数字化存在

WebPros 提供最具创新性的技术来实现数字世界。我们汇集产品和解决方案,使企业能够在线构建、运营和发展。我们的产品有助于管理服务器、网站、计费和在线营销。

关于蜘蛛爬虫名为webprosbot的简单分析-Eswlnk Blog
关于蜘蛛爬虫名为webprosbot的简单分析-Eswlnk Blog

从这里我们就可以实锤了,亚马逊云通过搭建WebPros爬虫系统分析竞争对手,来实现对网站的SEO监控。通过由闪电博的爬虫数据库查询得出,国内的WebPros的DNS大多数来源于亚马逊云,官网也没有给出明确答复。

动机分析

我们可以猜测,这是亚马逊云正在准备想在搜索引擎这块儿分一杯羹。毕竟一个做云托管服务的,不可能无缘无故就来爬取各大网站的网页,而且它爬取的网站与它的竞争对手大多数也是毫不相关。我们也就有理由相信它有向搜索引擎这块靠拢,毕竟是做云服务的,做做搜索引擎也是十分正常的。

本站默认网盘访问密码:1166
本站默认网盘访问密码:1166
webprosbot亚马逊云爬虫分析蜘蛛爬虫
2
1
Eswlnk的头像
Eswlnk
一个有点倒霉的研究牲站长
赞赏
关于如何运行二进制文件而不留下痕迹的研究
上一篇
Blumentals Surfblocker v5.x与PoiSoN的神秘火花
下一篇

评论 (1)

请登录以参与评论
现在登录
  • 的头像
    小伍同学

    可通过通过Robots协议屏蔽

    4 年前 • 天朝国度 • Unknown Unknown • 回复

猜你喜欢

  • 今日热点:伪Clash软件下载陷阱曝光,附防范建议
  • 「攻防对抗」利用 fastjson 原生反序列化与动态代理突破安全限制
  • 「攻防对抗」从上传漏洞到Getshell | 一次完整的渗透过程
  • 「日志记录」从零起步揭开路由器漏洞挖掘的面纱
  • 「攻防对抗」NSmartProxy流量特征的真实表现与应用
Eswlnk的头像

Eswlnk

一个有点倒霉的研究牲站长
1108
文章
319
评论
679
获赞

随便看看

「攻防对抗」实战Shellcode加密免杀主流杀软 | 加密技术应用与实现
2023-11-13 23:25:24
巧妙解决网站广告被屏蔽的问题|反屏蔽广告插件方法
2022-04-25 20:55:51
「原创教程」使用内存有限的 MCU 驱动电子纸显示器
2022-11-22 1:02:40

文章目录

专题展示

WordPress53

工程实践37

热门标签

360 AI API CDN java linux Nginx PDF PHP python SEO Windows WordPress 云服务器 云服务器知识 代码 免费 安全 安卓 工具 开发日志 微信 微软 手机 插件 攻防 攻防对抗 教程 日志 渗透分析 源码 漏洞 电脑 破解 系统 编程 网站优化 网络 网络安全 脚本 苹果 谷歌 软件 运维 逆向
  • 首页
  • 知识库
  • 地图
Copyright © 2023-2025 Eswlnk Blog. Designed by XiaoWu.
本站CDN由 壹盾安全 提供高防CDN安全防护服务
蜀ICP备20002650号-10
页面生成用时 1.046 秒   |  SQL查询 50 次
本站勉强运行:
友情链接: Eswlnk Blog 网站渗透 倦意博客 特资啦!个人资源分享站 祭夜博客 iBAAO壹宝头条
  • WordPress142
  • 网络安全64
  • 漏洞52
  • 软件52
  • 安全48
现在登录
  • 资源
    • 精彩视频
    • 破解专区
      • WHMCS
      • WordPress主题
      • WordPress插件
    • 其他分享
    • 极惠VPS
    • PDF资源
  • 关于我
    • 论文阅读
    • 关于本站
    • 通知
    • 左邻右舍
    • 玩物志趣
    • 日志
    • 专题
  • 热议话题
    • 游戏资讯
  • 红黑
    • 渗透分析
    • 攻防对抗
    • 代码发布
  • 自主研发
    • 知识库
    • 插件
      • ToolBox
      • HotSpot AI 热点创作
    • 区块
    • 快乐屋
    • 卡密
  • 乱步
    • 文章榜单
    • 热门标签
  • 问答中心反馈