大模型时代,金山云以云为基石,差异化打法布局未来

在生成式人工智能浪潮的推动下,每个企业都面临着如何紧跟时代潮流、创新业务模式的挑战。而这些挑战也给诸如云厂商等来了更多的发展新机遇。

作为一家在云计算领域深耕多年的企业,金山云始终关注着技术发展的趋势,并积极探索如何帮助企业将这些技术应用于实际业务中。一方面,金山云夯实云计算基础,通过技术和产品能力的升级,助大模型服务商更好地发展。另一方面,为了帮助特定领域行业用户提升效率,金山云围绕人工智能,探索行业大模型、模型平台以及知识助手以便更好地满足行业客户的业务需求。

金山云副总裁钱一峰表示,金山云延续中立的优势,依托底层算力网络优势以及混合云部署差异化优势,聚焦业务场景,更好地满足企业的实际需求,帮助企业创造更多的价值。

2023:坚实基础与创新前行的双轨战略

2023年,金山云采取了两步走的战略。首先,注重夯实基础,修炼内功其次,勇立潮头,紧跟大模型发展趋势,推出MaaS互信推理专区方案,解决模型及数据互信问题。

为了更好地服务企业客户,金山云推动了多款核心产品升级,包括服务器、对象存储、网络产品。这些产品的推出,不仅提升了金山云的技术实力,也为进一步开拓大模型市场奠定了坚实的基础。

在计算方面,金山云第七代云服务器X7进行了全方位的升级搭载了第四代英特尔至强可扩展处理器,并支持英特尔AMX原生加速能力。与上一代产品相比,CPU性能提升了60%,内存也升级到了DDR5,频率较上一代提升了50%。融合金山云自主创新的加速技术,云服务器X7可有效提升模型推理性能。

对象存储作为金山云推出的第一个公有云服务,也经历了不断优化和升级。随着AIGC的崛起,对存储性能的要求也越来越高。为了满足这一需求,金山云已覆盖五个品类的对象存储产品,包括极速型存储、标准存储、低频存储、归档存储和深度冷归档。其中,金山云对象存储KS3极速型最高可提供1Tbps/PB的兑付带宽,相较于传统的机械硬盘(HDD)的对象存储性能提升了上百倍。这些创新的产品为AIGC、存算分离和高性能计算等场景提供了强大的存储解决方案,确保客户的数据安全可靠。

针对大模型应用场景,金山云推出了互信虚拟私有网络(互信VPC)。相对标准VPC而言,互信VPC对进出VPC的通信行为进行了更为严格的控制,帮助客户解决合规和互信问题。针对HTTP、HTTPS等应用层负载场景,金山云还推出了应用型负载均衡ALB(Application Load Balancer),单实例最大支持100QPS,与云原生场景融合得非常好。当客户使用金山云容器服务KCE产品或自建K8s集群时,ALB可作为Ingress部署,为业务提供网络流量调度服务。

金山云始终保持敏锐的市场洞察力,紧跟技术发展的步伐不仅注重产品的性能和效率,还致力于为客户提供全方位的服务支持。金山云将继续加强云上能力建设,拓展云上产品场景化能力助力企业实现数字化转型和创新发展。

态度:严守中立,做大模型服务商的坚实后盾

金山云的公有云在服务大模型服务商时,严守中立的立场,致力于成为大模型的助力者,为模型服务商提供云服务支撑,从训练到推理的全流程,通过技术可监测的形式,在模型使用过程中,对模型的使用方式和使用日志提供可接入、可审计的能力,确保模型使用的透明度和可审计性。

为了满足大模型运行的高性能要求,金山云在基础架构层面进行了深入优化。将云服务器通过IBRoCE方式连接,提供了部署验收、性能测试和故障报警等功能。这为模型运行提供了一个强大的基础网络,确保了稳定性和高效性。

在云算力网络层面,金山云借助自研的IB/RoCE等技术,结合端侧和网侧交付验收工具,实现了整个链路的探测能力,对全网的性能进行全面测试。这为大模型的流畅运行提供了坚实的后盾。

为了增强云上运行的可靠性,金山云持续丰富裸金属产品形态,推出了与VPC无缝对接的云托管管理机和进出VPC流量日志审计功能。这些功能为大模型的稳定运行提供了全方位的保障。

PaaS层,金山云通过容器和K8s等技术,提供了故障检测、故障自动剔除等功能满足了大模型运营的稳定性需求确保了大模型的可靠运行。

值得一提的是,金山云发布了MaaS信推理专区2.0版本。这一版本基于金山云IaaS和PaaS底座,实现了LangChain的一键部署。它支持对接多个生态合作商业大模型和开源大模型,同时支持多种Embedding模型,并可无缝对接金山云全托管向量数据库Milvus。这为企业开发者提供了一个简单易用、安全可信的一站式推理应用部署平台。

为了增强云上运行的安全性,MaaS 2.0还提供了容器服务加密镜像解决方案。依托金山云裸金属服务,实现了从镜像加密、加密镜像上传到解密镜像运行的全流程模型安全运行。这一解决方案为企业提供了一个高度安全的大模型运行环境。

除了技术层面的保障,金山云还强调中立的立场和态度。金山云公有云产品中心负责人孙晓表示,金山云只触及容器服务这一层面,并确保大模型运行的可信度。通过技术手段和严格的管理流程确保了大模型在金山云平台上的安全和可靠运行。

据了解,诸多头部大模型服务商都是金山云的客户。尽管许多大模型服务商选择混合云部署,但金山云凭借其中立的立场和扎实的技术和服务创新,为大模型的发展提供了强有力的支撑。

聚焦:深入行业,满足特定领域的知识助手场景

面向企业级人工智能市场,金山云选择在企业内部比较基础、但上限又很高的场景,并面向工时价值高的特定领域,推出金山云轻舟智问知识助手产品。金山云人工智能与大数据产品中心负责人徐寅斐解释道,“‘基础’表达的是知识助手通过简单的问答对话框来进行交互,‘上限很高’指的是,当把模型的洞察力、理解能力、推理能力深度集成到企业内部流程后,知识助手又可以完成非常复杂的事情。”

为了实现这一目标,金山云围绕企业级知识助手场景制定了“一三一四”产品全景规划。一套知识问答的能力,可以以产品形态输出,也可以以元素化能力输出;三个核心模型,包括行业语言模型,文本分片,Embedding模型;一个平台指的是金山云瀚海平台,围绕大模型预训练和业务微调阶段,提供数据-训练-推理-评测的全生命周期关键环节产品能力;四大功能,包括微调推理、数据加速、智能检索和文档智能。

值得注意的是,前文提到金山云严守中立,成为大模型的助力者,为何又自己做行业大模型呢?对此,钱一峰表示,金山云不做模型,但一定会做企业的应用落地和平台落地的支撑。企业级市场需求相对比较碎片化,也是看到客户有很多业务需求,但是没有很好应用来满足他们的业务诉求,因此,金山云才依托于底层基础设施的能力,探索行业模型。

据了解,金山云正逐步完善行业模型的全栈能力,其中金山云轻舟智问知识助手计划优先在公共服务和法律两大场景落地助力政务服务和办公,以及法律咨询、诉讼以及非诉讼场景方面提升业务效率。

展望2024年,会是应用爆发的一年,因此推理资源的降本增效尤为重要。金山云也会通过算力虚拟化构建统一的算力池,加速推理速度,帮助更多行业用户进行业务创新,提升业务效率。

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/252837.html<

(0)
运维的头像运维
上一篇2025-04-29 15:14
下一篇 2025-04-29 15:15

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注