1月4日,金山云举办了「云+人工智能·时代新机遇」媒体沟通会,金山云副总裁钱一峰、金山云公有云产品中心负责人孙晓、金山云人工智能与大数据产品中心负责人徐寅斐在会上分享了金山云在基础能力、平台能力和模型服务等方面的技术历程和落地实践。通过技术自研和升级,金山云已初步建成人工智能时代民用领域全栈的云计算体系。
夯实基础全面升级人工智能服务能力
全球数字化浪潮风起云涌,云计算作为数字经济重要的支撑基础,正发挥越来越重要的作用。其中,智能化作为云计算3.0时代的重要理念,已成为数字基础设施升级的重要驱动力。知名调研机构IDC于2023年发布的报告显示,未来5年,以大模型、生成式人工智能驱动的下一代人工智能有望带动整体云产业穿过下行阶段,重回高增长时代。
顺应趋势,金山云深入探索前沿技术,围绕AIGC升级核心计算、存储、网络等产品,从多个维度全面拥抱人工智能。在计算方面,金山云第七代云服务器X7搭载第四代英特尔® 至强® 可扩展处理器、支持英特尔® AMX原生加速能力,CPU性能较上代最高提升60%,内存升级至DDR5,频率较上一代性能提升50%。融合金山云自主创新的加速技术,云服务器X7可有效提升模型推理性能。
根据数据从极热到极冷的不同热度,金山云对象存储已覆盖标准存储、低频存储、深度低频存储、归档存储、深度冷归档存储和全闪存储等不同访问热度的存储产品。其中,金山云对象存储KS3极速型最高可提供1Tbps/PB的兑付带宽,相较基于机械硬盘(HDD)的对象存储性能提升了上百倍,能为AIGC、存算分离和高性能计算等场景提供强有力的存储解决方案。
面向大模型应用场景,金山云推出互信虚拟私有网络(简称“互信VPC”)。相对于标准VPC,互信VPC对进出VPC的通信行为有着更为严格的控制,帮助客户解决合规和互信问题。针对HTTP、HTTPS等应用层负载场景,公司推出应用型负载均衡ALB(Application Load Balancer),单实例最大支持100万QPS。与云原生场景融合,客户在使用金山云容器服务KCE产品或自建K8S集群时,ALB都可作为Ingress部署,为业务提供网络流量调度服务。
当前,金山云全栈技术体系已形成以云产品基础设施为底座能力,云产品平台服务为核心技术能力,并通过MaaS互信推理专区方案和金山云轻舟智问为人工智能客户提供助力。
加速技术转化做大模型助力者
2023年被称为大模型“元年”。公开数据显示,从年初到年末,国内大模型数量超过200个。与“大模型”数量呈倍数级增长相反的是,真正被调用的大模型却相对较少。在本次大模型浪潮中,金山云坚持中立定位,充分发挥自身的底座和平台能力,做大模型的助力者。
在洞察到模型供需方的痛点后,金山云于去年6月率先推出MaaS互信推理专区方案(以下简称“MaaS 1.0”),在大模型厂商、用户和金山云之间建立互信,以解决模型及数据的互信问题。本次沟通会上,金山云发布MaaS互信推理专区方案2.0(以下简称“MaaS 2.0”)。
在MaaS 1.0基础上,MaaS互信推理专区方案2.0以金山云IaaS和PaaS为底座,可实现云上LangChain的一键部署,默认对接多个生态合作商业大模型和开源大模型。同时支持包括BGE、Bert等在内的Embedding模型,能无缝对接金山云全托管向量数据库Milvus,提供面向企业开发者的简单易用、安全可信的一站式推理应用部署平台。此外,MaaS 2.0支持通过标准化的API接口和Web前端界面,实现包括模型推理和知识库搭建的RAG大模型场景应用。为进一步增强云上运行的安全性,MaaS 2.0还提供容器服务加密镜像解决方案,依托金山云裸金属服务,实现在金山云容器服务中从镜像加密、加密镜像上传、解密镜像运行的全流程模型安全运行。
同时,为满足行业客户的需求,金山云探索大模型时代企业赋能新机遇,围绕企业级知识助手场景制定了“一三一四”产品全景规划,即一套能力(金山云轻舟智问)、三个模型(行业语言模型、文本分片和Embedding模型)、一个平台(金山云瀚海平台)及四大功能(微调推理、数据加速、智能检索和文档智能),围绕生成式人工智能构建应用落地、模型训练微调、平台支撑的全栈能力。基于“一三一四”规划,金山云将分别针对应用型客户和平台型客户输出多项原子能力。目前,金山云轻舟智问知识助手产品已完成应用以及Embedding模型、多路召回算法和智能数据切片模型等核心技术的建设,计划优先在公共服务和法律场景落地。
与人工智能的结合,给了云更多的想象空间,也给各行业都带来了新的生产力。随着技术的进一步完善和落地,云计算将迎来更强更久的生命力。金山云将持续围绕客户需求“练内功”,携手生态伙伴以差异化打法布局未来。