UCloud AI 在线服务推出GPU版本 主攻低延时场景

UCloud AI 在线服务推出GPU版本 主攻低延时场景

2018-08-08 15:22:34

云计算 随着人工智能技术演进和AI细分化领域日趋成熟,对云服务商的AI产品能力也提出了更高要求。近日,UCloud AI在线服务平台推出独占型GPU推理节点,提供高性能AI在线推理服务。GPU在线服务节点主要面向对深度学习AI在线推理服务有低延时要求的应用场景。

前言

自去年5月开启免费公测和正式上线以来,UCloud AI在线服务UAI-Inference已帮助许多初创企业、大型传统企业降低了AI技术门槛和成本投入,有利抓住了人工智能风口。UAI-Inference因其易部署、易运维、支持多种主流AI框架以及安全可靠的特性,可适用于机器学习、视频图像识别、自然语言处理等多种AI应用场景。

随着人工智能技术演进和AI细分化领域日趋成熟,对云服务商的AI产品能力也提出了更高要求。近日,UCloud AI在线服务平台推出独占型GPU推理节点,提供高性能AI在线推理服务。GPU在线服务节点主要面向对深度学习AI在线推理服务有低延时要求的应用场景。

P40高性能GPU加速卡提供算力保障

人工智能爆发的第三波浪潮离不开计算能力的提升,而算力提升的背后离不开GPU的广泛使用。UAI-Inference的GPU节点采用NVIDIA P40高性能GPU加速卡,提供稳定、高效的算力保障。

UAI-Inference GPU在线服务平台同UAI-Inference CPU平台一样,可提供海量计算节点、自动负载均衡、节点容灾、服务监控、服务版本灰度管理等功能。同时,UAI-Inference GPU在线服务支持用户随时调整在线服务GPU节点规模,实时应对线上业务负载变化。

UAI-Inference GPU在线服务平台基于Docker容器技术实现,用户仅需提供在线推理的容器实现即可。在线服务平台的GPU节点预制NVIDIA GPU以及Docker的执行环境,可以实现服务集群快速扩容。另外,UAI 团队提供主流AI框架的基础容器镜像,支持范围包括:TensorFlow/Caffe/MXNet/Keras等。

三大场景延时降低效果显著

UAI-Inference GPU在线服务利用P40 GPU强劲性能可以将在线Inference的效率提升10倍以上。

例如,图像分类场景利用UAI-Inference独占型GPU在线服务,Inception-V3和ResNet101两个算法模型在batchsize=1时的推理延时,相对8C8G的CPU云主机性能有明显提升,可以将请求延时降低至50ms以内,如下图所示:

针对文字检测场景,利用UAI-Inference独占型GPU在线服务,CTPN和EAST两个算法模型在batchsize=1时的推理延时,相对8C8G的CPU云主机性能有明显提升,可以将请求延时从秒级优化至100ms级,如下图所示:

针对目标检测场景,利用UAI-Inference独占型GPU在线服务,Fast RCNN算法模型在batchsize=1时的推理延时,相对8C8G的CPU云主机性能有明显提升,可以将请求延时降低接近5倍,如下图所示:

弹性付费成本更低

目前,主要的人工智能应用场景的实现方式之一是基于云端AI,即用户通过网络将要处理的数据上传到云平台,在云平台大规模计算并进行建模、识别等处理,***再将计算结果传到本地。该方式的主要优势在于弹性可快速部署,能随时根据用户的实际业务需求对计算节点进行调整。

UAI-Inference GPU在线服务平台针对业务处于高峰或低峰的不同阶段,支持用户随时调整GPU集群的节点数量,对GPU集群进行横向扩展和回缩。因此用户可以按照实际需求调整资源,无需担心资源闲置浪费。此外,还提供精确到分钟的计费维度,独占服务P40 GPU节点仅0.085元/节点*分钟。

人工智能的发展前景被越来越看好,云服务商作为企业AI转型的基础设施支撑平台,将会面临更多挑战,但为了进一步满足用户的需求,UCloud将在探索AI产品的道路上不断创新。

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/247910.html<

(0)
运维的头像运维
上一篇2025-04-27 08:20
下一篇 2025-04-27 08:21

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注