2026 年 3 月 20 日,,,,华为中国合作伙伴大会 2026 期间,,,,以 “与时代,,共昇腾” 为主题的昇腾人工智能伙伴峰会在深圳成功举行。。华为昇腾计算业务总裁张迪煊发表《一起昇腾,,,,共赢行业智能化》主题演讲,,指出 AI 正从生成式 AI 迈向 Agentic AI,,,2026 年将成为强化学习及 Agent 应用规模落地元年,,昇腾将打造大、、、中、、小三大核心算力场景,,携手伙伴共探行业智能化落地加速路径。。。。

华为昇腾计算业务总裁 张迪煊
一、、、开源开放筑生态,,,昇腾与伙伴携手共赢
2025 年是昇腾沉淀技术、、、拥抱开源的关键一年,,,同年 8 月昇腾正式宣布 CANN 和 Mind 系列软件全面开源开放、、架构解耦,,,,并积极向业界贡献关键特性。。其中,,联合科大讯飞落地的大 EP 技术贡献至 vLLM 社区,,,,填补了业界多机推理加速能力的空白。。
目前昇腾已向三方社区累计贡献超 11 万行代码,,在毕昇编译器层构建 AscendNPU IR 平滑对接 Triton,,,兼容 FSDP2、、、、vLLM 等 50 多个主流开源社区和项目,,实现开源模型 0day 支持,,让开发者可快速落地训练与推理创新。。。同时,,,众多 SOTA 开源模型基于昇腾原生孵化,,,,如智谱基于昇腾仅三个月完成的多模态大模型 GLM-Image,,,开源 24 小时即登顶 Hugging Face Trending 榜第一。。
在一体机产品领域,,,,昇腾在 DeepSeek 发布后快速推出参考配置,,,,使能 80 多家伙伴 2 周内发布自研产品。。。一年时间里,,,已有 350 多家伙伴打造 400 多款行业场景一体机,,服务 2700 多家客户,,占据国内一体机市场 80% 以上份额,,,,加速大模型行业落地。。。
二、、、AI 迈入 Agentic 时代,,2026 成强化学习 + Agent 应用落地元年
过去三年 AI 行业实现跨越式发展:2023 年 “大模型元年” 让模型从感知理解走向生成创造;2024 年 “大模型推理元年” 确立 Tokens 为 AI 时代新量纲;2025 年国产大模型开源爆发,,Tokens 使用量席卷千行万业。。。。
当前 AI 正式迈入 Agentic AI 时代,,,实现从 “会聊天” 到 “能办事” 的升级。。。To C 端,,,OpenClaw 成为现象级开源应用,,,短时间内收获超 32 万 star、、、百万新增用户,,,国内头部互联网纷纷布局智能体入口;To B 端,,,,AI 深度渗透生产决策环节,,强化学习成为基座模型落地行业核心场景的必选之路,,,,而海量 Tokens 成为核心支撑,,其计算效率直接决定企业核心收益。。。。
三、、、、大中小系列化算力开放,,,适配全场景差异化需求
结合 AI 发展趋势与客户需求,,,,昇腾打造三大核心算力场景,,,全方位满足行业差异化需求,,,,助力伙伴深耕行业智能化:
- 大算力场景:聚焦大模型预训练、、、强化学习后训练及大规模推理服务,,,,昇腾将打造领先超节点架构及产品,,开放灵衢协议、、、部件及参考架构,,,赋能企业重塑核心业务;
- 中算力场景:覆盖辅助医疗、、、、智慧教学等主流行业应用,,,,围绕 “开箱即用” 打造 “快速部署 + 成本可控” 的平衡,,,,开放中心模组 / 刀片,,,,支持伙伴打造大模型应用一体机、、、、高密服务器;
- 小算力场景:聚焦工业质检、、具身智能、、科研教学等智能边端领域,,,,针对客户 “灵活高效、、、成本可控” 的诉求,,开放标准模组和板卡,,使能伙伴打造多样化边缘算力设备,,,,挖掘海量市场潜力。。。
四、、、、核心技术创新,,,打造全场景最佳解决方案
1. 超节点 + 大 EP,,破解大规模推理服务痛点
AI Agent 的普及带来百倍级 Tokens 需求和 10ms 级时延要求,,,传统服务器堆叠模式存在内存独立编址、、、、跨节点交互性能开销大的问题。。。。昇腾 384 超节点实现 48TB 内存统一编址、、、全局内存共享,,,共享内存容量较传统方式提升 96 倍,,,NPU 间通过内存语义直接交互,,数据交互效率提升 3 倍,,,可实现更高 KVCache,,,,满足 Agent 超长上下文需求,,,,成为大规模推理的最优选择。。
同时昇腾为伙伴提供三条灵活实现路径:复用 MindIE 成熟大 EP 方案快速部署、、、、合入 vLLM/SGLang 开源推理引擎降低迁移成本、、基于 CANN 深度定制极致性能推理引擎。。。目前硅基流动、、、清昴智能等伙伴已基于该能力打造推理引擎,,,,为金融行业提供服务,,,实现多轮任务应答速度提升 3 倍。。
2. 异步流式数据引擎 TQ,,,优化强化学习后训练
针对强化学习后训练场景,,昇腾沉淀全流程最佳实践,,提供一键部署的 Docker 镜像,,,解决业界普遍关注的训推资源调度难题。。。。创新推出的 “异步流式数据引擎 TQ” 技术,,,实现控制流与数据流解耦,,,,样本数据无需经控制器中转,,依托超节点内存统一编址实现训推节点快速数据交互,,,端到端性能提升 40% 以上,,该特性已合入 verl 社区并应用于广告、、、、信贷风控等核心场景。。
3. 软硬件全面升级,,开源 Agent 参考设计打造 “Claw 一体机”
面向国计民生大模型应用场景,,,昇腾产品分级分档升级:百亿级模型适配 A2 标卡,,内存带宽达业界 1.8 倍,,实现 100ms 推理时延;千亿级模型搭配单机服务器,,算力达业界 2.3 倍;万亿级模型采用双机超节点服务器,,,为业界唯一可部署 T 级模型的产品,,,算力达业界 3.78 倍,,突破 20ms 低时延。。
同时昇腾推出 Agentic 开源参考设计,,,打包优化后的推理引擎、、开源模型权重及 OpenClaw 框架为完整镜像,,伙伴只需聚焦业务集成与 Skill 开发,,,即可快速打造 Agent 应用一体机。。基于双机超节点服务器的一体机,,,可实现每日 20 亿 Tokens 供给,,,,目前已有 20 多家伙伴落地相关产品,,,,服务教育、、、、医疗、、金融等核心领域。。。
4. Atlas 350 加速卡,,赋能推荐 / 多模态 / LLM 三大推理场景
昇腾发布 Atlas 350 加速卡,,搭载全新昇腾 950PR 处理器,,性能较业界同类产品领先 1 至 1.4 倍,,,,聚焦推荐、、、、多模态、、、、LLM 三大核心推理场景:算力内存双升级,,单卡算力达业界 2.8 倍以上,,,支持 mxFP4 低精格式,,,,片上内存最大 112GB,,,,多模态生成性能提升 60%;访存粒度降至 128 字节,,,,海量小算子访存效率提升 4 倍;支持 SIMT+SIMD 混合编程,,开发更灵活,,,满足伙伴多样化需求。。。。
五、、深耕行业场景,,,技术与业务深度融合
2025 年 9 月,,,昇腾联合 20 多家 ISV 启动金融、、、、能源等 5 大行业应用场景解决方案打造工作,,,,半年内孵化出辅助办公、、、AI 实训、、、电子病历等十余个方案,,,,落地 180 多家客户。。。其中在智慧文旅领域,,联合海天瑞声、、陕文投打造的多模态 AI 伴游助手 “小七”,,已在陕西各大景点投放,,为 400 多万游客提供个性化出游服务。。
在智能边端领域,,昇腾开放多档位、、高集成度的模组 / 板卡,,,结合多 OS 兼容、、多场景 SDK,,使能伙伴打造多样化产品。。。软通华方、、同泰怡等伙伴基于 Atlas 300I A2 打造的液冷 AI 工作站,,具备静音、、、高密、、省电等优势,,,,成为科研仿真、、医疗、、、、金融等行业本地算力设备首选。。。
六、、、CANN 开源开放升级,,,降低创新门槛
昇腾 CANN 开源开放实现三大核心升级,,进一步提升伙伴开发与部署效率:
- 部署效率升级:将原有 8 个大包拆分为 29 个独立组件,,,,包大小从 2G 缩减至 0.43G,,特性加载时间从 2 分钟缩短至 20 秒;
- 开发体验升级:实现主流算子编程框架无感对接,,,2026 年将开源 PyPTO 编程范式,,,,使算子代码量平均减少 70%,,,,可视化调试让复杂算子开发缩短至一周,,同时提供开源 Skill 库支持算子自动生成 Agent;
- 社区资源升级:完善开源社区 CI/CD 流水线,,,2026 年 6 月将开放 2000 卡免费算力资源,,,,大幅降低开发者创新门槛。。。
七、、、五大创新方向,,,,共筑可持续 AI 产业生态
昇腾围绕硬件、、、、算子、、、加速库、、、、模型、、、、应用五大创新方向,,,以社区化运作模式赋能伙伴发展:完善激励机制与知识体系,,,开放能力认证加速伙伴能力转型;下发丰富创新任务,,,,设立 2000 万首批创新激励基金;深化昇腾万里伙伴计划,,,,升级 5000 万 NRE 鼓励伙伴创新,,,,创新成果将上架社区 AI 应用市场,,,,实现联合推广、、、、共享收益。。
张迪煊表示,,,,昇腾与伙伴已并肩走过 7 年 AI 发展之路,,,见证了行业从探索起步到场景落地的全过程。。。未来昇腾将持续以开源开放为核心,,,,与更多伙伴携手打造可持续、、有韧性的 AI 产业生态,,共同推动行业智能化迈向新高度,,共赢行业智能化时代新机遇。。
版权声明:本文转载自鲲鹏昇腾开发者社区,,,,仅用于行业资讯交流与技术分享,,,不代表本公司立场,,,,不用于任何商业用途。。。。版权归原作者及原出处所有,,如有侵权,,,,请联系我们及时删除