近日,联想百应智能体正式宣布引入国产AI大模型DeepSeek 。DeepSeek凭借技术上的高度创新备受关注,相比ChatGPT等模型,DeepSeek采用混合专家模型,可将任务拆分给多个专用子模块处理,资源利用率更高,大幅降低了大模型训练所需的算力要求。作为国内首个面向中小企业的IT服务智能体,联想百应智能体与DeepSeek实现深度融合,能为万千企业的智能化转型和发展提供助力。

联想百应智能体是基于智能IT引擎“擎天3.0”所打造的一站式服务平台。这次与DeepSeek在技术上实现深度融合,将有效帮助联想百应智能体丰富技术“武器库”,多模态交互、可视化思维链、多方案博弈、多智能体协作、全链路安全五大技术能力都将得到进一步增强。
在算力调度方面,DeepSeek 的渐进式分层知识蒸馏技术独具优势,它能够把大型模型蕴含的知识,精准迁移到更为轻量化的模型之中。这样一来,在保证模型性能不受影响的前提下,还能显著降低对计算资源的消耗。当这项技术与擎天 3.0 的混合架构调度能力相结合,就能最终实现 “端 - 边 - 云 - 网 - 智” 的高效协同运作。这对于企业而言意义重大,企业可以在边缘设备上轻松部署轻量化模型,减少对云端算力的依赖,从而进一步降低运维成本。
在模型架构层面,百应服务大模型的 MoE 架构由多个专门的 “专家模型” 构成。这些专家模型各自针对特定任务进行了优化,比如 IT 问题诊断、AI 办公等场景,这种设计能有效减轻计算负载。而 DeepSeek 同样具备全球领先的模型架构,其 DeepSeek R1 模型就采用了 MoE(稀疏混合专家模型)架构。引入 DeepSeek 后,能为百应服务大模型 MoE 的动态调度提供更有力的支持。具体来说,它可以依据输入特征,智能选择最为匹配的专家模型,进而提升处理效率与输出质量,充分满足企业级场景对于资源高利用率的严格要求。

和封闭源代码的国际大模型不同,DeepSeek R1 有着开源、性能卓越、成本低廉这三大突出长处。DeepSeek 依据 MIT 许可协议,毫无保留地开放其多模态、多规格的模型,这种开源举措极大地推动了相关技术在各个领域的扩散。在这样的技术生态环境里,企业可以按照自身的实际需求,从众多选项中挑选出适配的模型与智能体。不仅如此,企业还能够依托自身业务所积累的数据,进行定制化的模型训练与推理操作,塑造出更符合自身业务特性的专属岗位智能体。
DeepSeek只是新一轮大模型热潮的起点,相信联想百应智能体将持续深化探索强化学习、多模态融合等前沿技术,进一步提升模型定制化能力。