Eswlnk Blog Eswlnk Blog
  • 资源
    • 精彩视频
    • 破解专区
      • WHMCS
      • WordPress主题
      • WordPress插件
    • 其他分享
    • 极惠VPS
    • PDF资源
  • 关于我
    • 论文阅读
    • 关于本站
    • 通知
    • 左邻右舍
    • 玩物志趣
    • 日志
    • 专题
  • 热议话题
    • 游戏资讯
  • 红黑
    • 渗透分析
    • 攻防对抗
    • 代码发布
  • 自主研发
    • 知识库
    • 插件
      • ToolBox
      • HotSpot AI 热点创作
    • 区块
    • 快乐屋
    • 卡密
  • 乱步
    • 文章榜单
    • 热门标签
  • 问答中心反馈
  • 注册
  • 登录
首页 › 其他分享 › 「其他分享」Alluxio 开源数据编排技术

「其他分享」Alluxio 开源数据编排技术

Eswlnk的头像
Eswlnk
2022-08-16 16:25:34
「其他分享」Alluxio 开源数据编排技术-Eswlnk Blog
智能摘要 AI
Alluxio 是一种开源数据编排技术,主要用于云计算和人工智能,旨在连接数据驱动程序与存储设备,提升数据访问效率。它为多种存储系统(如Amazon S3、Google Cloud Storage等)和数据处理框架(如Apache Spark、TensorFlow等)提供统一的API和命名空间。Alluxio的优势包括内存速度I/O、简化云存储接入、简化数据管理和应用程序部署简易。其技术创新体现在全局命名空间、智能多层级缓存和服务器端API翻译转换。Alluxio已在数百家机构部署,最大集群规模超1500节点。用户可通过官方文档快速上手并获取支持资源。

什么是 Alluxio

Alluxio是全球首个开放源码的数据处理技术,该技术主要用于云计算和人工智能。这架起了一个由资料驱动的程序和储存装置组成的桥,可以把资料从储存层面转移到更接近于资料驱动程序的地方,这样就可以方便地进行存取。它也可以让你的应用软件与很多储存设备之间的联系。基于 Alluxio的分层结构可以让您的资料更快速地被存取。

在大数据的生态体系中, Alluxio是一个数据驱动的架构或程序(例如 Apache Spark, Presto, Tensorflow, Apache HBase, Apache Hive或 Apache Flink),以及诸如亚马逊S3,谷歌云商店, OpenStack Swift, HDFS, GlusterFS, IBM Cleversafe, EMC ECS, Ceph, NFS, Minio, Alibaba OSS)。Alluxio将所有的数据整合到不同的存储器中,并为它们的高级数据驱动程序开发了一个通用的 API和一个通用的名称。

Alluxio工程来源于 UC Berkeley的 AMPLab (参见文章), BDAS (Berkeley Data Analytics Stack)中起到了数据存取的作用。该软件采用 Apache License2.0的方法进行开放。Alluxio是发展最迅速的大型开放源码大数据计划,它在阿里巴巴, Alluxio,百度, CMU,谷歌, IBM, Intel,南京大学,红帽,腾讯, UC贝克利,以及雅虎。

到今天为止,Alluxio 已经在数百家机构的生产中进行了部署,最大部署运行的集群规模超过 1500 个节点。

「其他分享」Alluxio 开源数据编排技术-Eswlnk Blog

优势

通过简化应用程序访问其数据的方式(无论数据是什么格式或位置),Alluxio 能够帮助克服从数据中提取信息所面临的困难。Alluxio 的优势包括:

  • 内存速度 I/O:Alluxio 能够用作分布式共享缓存服务,这样与 Alluxio 通信的计算应用程序可以透明地缓存频繁访问的数据(尤其是从远程位置),以提供内存级 I/O 吞吐率。此外,Alluxio的层次化存储机制能够充分利用内存、固态硬盘或者磁盘,降低具有弹性扩张特性的数据驱动型应用的成本开销。
  • 简化云存储和对象存储接入:与传统文件系统相比,云存储系统和对象存储系统使用不同的语义,这些语义对性能的影响也不同于传统文件系统。在云存储和对象存储系统上进行常见的文件系统操作(如列出目录和重命名)通常会导致显著的性能开销。当访问云存储中的数据时,应用程序没有节点级数据本地性或跨应用程序缓存。将 Alluxio 与云存储或对象存储一起部署可以缓解这些问题,因为这样将从 Alluxio 中检索读取数据,而不是从底层云存储或对象存储中检索读取。
  • 简化数据管理:Alluxio 提供对多数据源的单点访问。除了连接不同类型的数据源之外,Alluxio 还允许用户同时连接同一存储系统的不同版本,如多个版本的 HDFS,并且无需复杂的系统配置和管理。
  • 应用程序部署简易:Alluxio 管理应用程序和文件或对象存储之间的通信,将应用程序的数据访问请求转换为底层存储接口的请求。Alluxio 与 Hadoop 生态系统兼容,现有的数据分析应用程序,如 Spark 和 MapReduce 程序,无需更改任何代码就能在 Alluxio 上运行。

技术创新

Alluxio 将三个关键领域的创新结合在一起,提供了一套独特的功能。

  1. 全局命名空间:Alluxio 能够对多个独立存储系统提供单点访问,无论这些存储系统的物理位置在何处。这提供了所有数据源的统一视图和应用程序的标准接口。有关详细信息,请参阅统一命名空间文档。
  2. 智能多层级缓存:Alluxio 集群能够充当底层存储系统中数据的读写缓存。可配置自动优化数据放置策略,以实现跨内存和磁盘(SSD/HDD)的性能和可靠性。缓存对用户是透明的,使用缓冲来保持与持久存储的一致性。有关详细信息,请参阅 缓存功能文档。
  3. 服务器端 API 翻译转换:Alluxio支持工业界场景的API接口,例如HDFS API, S3 API, FUSE API, REST API。它能够透明地从标准客户端接口转换到任何存储接口。Alluxio 负责管理应用程序和文件或对象存储之间的通信,从而消除了对复杂系统进行配置和管理的需求。文件数据可以看起来像对象数据,反之亦然。

快速上手指南

如果打算快速地搭建 Alluxio 并运行,请阅读快速上手指南页面,该页面描述了如何部署 Alluxio 并在本地环境下运行示例。

或者,你也可以尝试我们为Presto & Alluxio制作好的快速上手教程,具体点击如下图片链接:

「其他分享」Alluxio 开源数据编排技术-Eswlnk Blog

下载和有用资源

你可以从 Alluxio 下载页面获取已发布版本。 每个Alluxio发布版本都提供了与不同 Hadoop 版本兼容的预编译好的二进制文件。 从 Master 分支构建 Alluxio页面解释了如何从源代码编译生成Alluxio项目。 如果你有任何疑问,请联系我们用户邮件列表 或者我们的社区Slack频道。

ESWINK , 版权所有丨如未注明 , 均为原创

原文标题:「其他分享」Alluxio 开源数据编排技术

「其他分享」Alluxio 开源数据编排技术-Eswlnk Blog
本站默认网盘访问密码:1166
本站默认网盘访问密码:1166
AlluxioapacheAPI云存储大数据开放源代码
0
0
Eswlnk的头像
Eswlnk
一个有点倒霉的研究牲站长
赞赏
「其他分享」Windows 10 隐藏6 个用户文件夹
上一篇
「其他分享」JuiceFS 专为云上大数据打造的存储方案
下一篇

评论 (0)

请登录以参与评论
现在登录
    发表评论

猜你喜欢

  • 「亲测有效」Google Gemini 学生优惠:解决身份验证和支付卡验证
  • 解决国际版EdgeOne绑卡和手机验证问题
  • 小工具开发之EdgeOne免费计划兑换工具
  • 「日志记录」逆向必应翻译网页版API实现免费调用
  • 「其他分享」市面上静态页面服务商比较与推荐:选择最适合您的平台
Eswlnk的头像

Eswlnk

一个有点倒霉的研究牲站长
1108
文章
319
评论
679
获赞

随便看看

豆瓣2021年电影和音乐榜单
2022-08-09 10:54:17
「其他分享」kubeSphere运行基于外置存储nacos
2022-08-18 23:22:43
「其他分享」Docker版harbor实现开机自启
2022-08-23 12:23:59

文章目录

专题展示

WordPress53

工程实践37

热门标签

360 AI API CDN java linux Nginx PDF PHP python SEO Windows WordPress 云服务器 云服务器知识 代码 免费 安全 安卓 工具 开发日志 微信 微软 手机 插件 攻防 攻防对抗 教程 日志 渗透分析 源码 漏洞 电脑 破解 系统 编程 网站优化 网络 网络安全 脚本 苹果 谷歌 软件 运维 逆向
  • 首页
  • 知识库
  • 地图
Copyright © 2023-2025 Eswlnk Blog. Designed by XiaoWu.
本站CDN由 壹盾安全 提供高防CDN安全防护服务
蜀ICP备20002650号-10
页面生成用时 0.501 秒   |  SQL查询 47 次
本站勉强运行:
友情链接: Eswlnk Blog 网站渗透 倦意博客 特资啦!个人资源分享站 祭夜博客 iBAAO壹宝头条
  • WordPress142
  • 网络安全64
  • 漏洞52
  • 软件52
  • 安全48
现在登录
  • 资源
    • 精彩视频
    • 破解专区
      • WHMCS
      • WordPress主题
      • WordPress插件
    • 其他分享
    • 极惠VPS
    • PDF资源
  • 关于我
    • 论文阅读
    • 关于本站
    • 通知
    • 左邻右舍
    • 玩物志趣
    • 日志
    • 专题
  • 热议话题
    • 游戏资讯
  • 红黑
    • 渗透分析
    • 攻防对抗
    • 代码发布
  • 自主研发
    • 知识库
    • 插件
      • ToolBox
      • HotSpot AI 热点创作
    • 区块
    • 快乐屋
    • 卡密
  • 乱步
    • 文章榜单
    • 热门标签
  • 问答中心反馈