阿里巴巴通用计算平台负责人关涛:企业级大数据计算平台的演进

阿里巴巴通用计算平台负责人关涛:企业级大数据计算平台的演进

作者:佚名 2018-10-08 12:08:43

云计算 “计算力,联合计算,智能化和企业级服务能力,构成完整的面向企业的大数据平台,阿里巴巴用整套大数据计算能力,持续驱动数字中国。”

计算的价值绝不止于计算本身,而是带来更多的洞察和更强的驱动。

在2018杭州云栖大会主论坛上,阿里巴巴通用计算平台负责人关涛表示,“最初我们希望数字化阿里巴巴,后来,希望把数字化普惠到企业层面,现在开始数字化一个城市。”同时,他还从计算力、联合计算、智能化、企业级服务能力四个方面介绍了阿里巴巴统一大数据计算平台的探索与实践。

数字化城市背后的计算能力

 

MaxCompute是阿里巴巴9年前做飞天系统的三大件之分布式计算部分。9年后的今天,它已经成为可以承载EB级的数据存储能力,百PB级的单日计算能力,公共云覆盖国内外十几个国家和地区,专有云包含城市大脑在内部署了超过100+套。

ET城市大脑作为杭州城市背后的数据支撑系统,无疑是对数字和计算的一个***要求。要想做到算得起,算的快,算的准,必须有一个强大的计算平台。

从系统架构上看,MaxCompute底层包含异构的计算集群,通过统一的元数据管理和调度系统联动在一起。向上提供包括批计算、流计算、内存计算、机器学习、迭代等一系列计算能力。

计算平台:计算力是最核心的指标

2015年GraySort 竞赛中,MaxCompute用377秒完成了100TB数据排序,获得世界冠军。2016年拿下CloudSort***成绩,这表明不仅算得快,而且算得便宜。

2017年挑战TPCX-Bigbench 100TB的30个query指标,成为***个测试通过的计算引擎。2018年在同样100TB规模上,性能指标提升了一倍。另外在超小型10TB规模的指标上,性能超过其他开源竞品3倍。

“通过对计算力的持续升级,使得计算力更便宜,智能化更普惠。”

计算下推比数据上移更高效

通常用户上云,数据不会在一个系统里。对于在线服务,数据通常会在数据库里支撑前台业务,对于半结构化log和非结构化的音视图等数据通常存储在数据湖里。前端数据库的数据有非常丰富的index的支持,可以算的非常高效,后端是超大规模存储,中间是一个大数据体系,把结构化数据以列式的方式存储下来,支撑超大规模的数据计算。

但这样会面临的一个挑战就是用户如何把所有数据放在一起来算,得到一个***的结果?面对这种挑战,通常有两种解法,一种是数据上移概念,就是把所有数据上移到同一系统中,上传同步后进行计算。而此时会有三个问题,一是出现数据冗余,相当于把同样数据备份了一到两份;二是同步存在延迟,在延迟里无法进行计算;三是实时性会受到影响。
“基于此提出了联合计算的概念,我们认为计算下推比数据上移更高效。”
什么是联合计算呢?就是不需要数据同步,通过在大数据系统中的一个作业,可以联动其它系统。每一部分都依赖于当时系统***的优化,做***的决策,在这个层面上实现数据之间的联动和打通。

Auto Data Warehouse让大数据自动驾驶

五年前阿里巴巴正面对数据爆发式增长的巨大挑战,以人的理解力,无法理解这些数据之间的关系和作业之间的关系,因为它太过于复杂。数据有没有冗余?计算是不是可以复用?如果某个作业失败了,某个数据出了问题,到底影响面有多大?

所以五年前,从最基本的数据可发现开始,然后做数据血缘,找到数据间的关系,看数据冷热之间分离能力,再看数据自动优化。***,当有一张新数据表进来时,可以自动去找关联关系,这就是Auto Data Warehouse数据自动驾驶系统。这套系统在阿里巴巴内部实现了在计算优化上提升了35%,在数据冗余去重层面降低了20%的存储能力,在资源规划上,提升了超过75%的计算效率。

MaxCompute是面向企业的完整服务,不只是单一引擎

杭州城市大脑除了对系统计算力的要求之外,还包含稳定性,容灾能力,可恢复能力,以及弹性能力等。当遇到突发情况时要有预警能力和自恢复能力。所有能力总结成一个词就是“企业化的能力。” MaxCompute不止是计算引擎,而是一套完整的企业化服务。
除计算外,MaxCompute还包含账号、项目管理、数据安全、监控、金融性容灾等系统等。今年新推出了DQC数据正确性验证系统,并全新升级了DataWorks开发和调试平台,具备数据集成,作业pipline管理系统,可实现与机器学习、数据分析和BI平台的联动。

“计算力,联合计算,智能化和企业级服务能力,构成完整的面向企业的大数据平台,阿里巴巴用整套大数据计算能力,持续驱动数字中国。”

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/264470.html<

(0)
运维的头像运维
上一篇2025-05-05 01:18
下一篇 2025-05-05 01:19

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注