汇正财经:昇腾推理新芯片,填补国产高端空白
面对人工智能向 AGI(通用人工智能)演进的核心需求,华为2025 年发布的昇腾芯片路线图,以 “一年一代算力翻倍” 的速度重构全球 AI 算力格局。在昇腾产业峰会上,华为明确了从 2026 年至 2028 年的芯片迭代规划,涵盖 Ascend 950、960、970 三大系列,通过架构创新与技术开源,为中国 AI 算力筑牢自主根基。
即将于 2026 年一季度推出的 Ascend 950PR 芯片,针对性解决推理 Prefill 阶段与推荐业务的算力痛点。其创新采用华为自研低成本 HBM 存储 HiBL 1.0,在支持 FP8/MXFP8 等多低精度数据格式的同时,将算力提升至 1P FLOPS,大幅降低电商、内容平台等场景的 AI 部署成本。而面向训练与推理 Decode 阶段的 Ascend 950DT,则搭载高性能 HiZQ 2.0 存储,内存容量达 144GB,互联带宽提升至2TB/s,可满足大模型训练的高带宽需求,计划于 2026 年四季度上市。
更值得关注的是技术开放战略:华为宣布将 CANN 编译器接口开放,Mind 系列工具链与 openPangu 基础大模型全面开源,且 2025年底前完成 Ascend 910B/C 的开源适配。这种 “硬件变现 + 软件开源” 的组合,既保障了核心技术的商业价值,又通过开放生态吸引全球开发者参与 —— 仅 DeepSeek 等客户反馈驱动的优化,就使昇腾芯片推理能力快速满足产业需求,印证了开放协同的创新效率。
随着模型能力提升,智能体(Agent)与多模态应用进入深水区。智能体方面,2026 年初,名为 OpenClaw 的开源智能体工具在开发者社区和各大技术论坛引起较大轰动,它不再是过去那个只会陪聊的聊天机器人,而是进化成了能够接管电脑、协助人类完成具体办公任务的“办公搭子”,初步展示了生产力大变革的形象。
多模态方面,字节发布的 SeeDance2.0 让大模型具有了影视行业的生产力,从此前“生成一段画面”走向“完成一个作品”,生成15 秒视频的可用率从此前 20%提升至 90%,提升效率降低成本,有望推动漫剧等行业进入规模化发展阶段。随着大模型能力提升,这两条演进路径逐步清晰:Agent 通过理解用户意图、拆解复杂任务,搭载 MCP 和 Skills 等工具,快速覆盖商业办公、法律和金融领域应用;多模态有望通过生成仿真数据,进一步用于加速具身智能等场景。
算力涨价成为新迹象,凸显算力供应瓶颈,算力产业链有望持续受益。智谱于 2 月 12 日发布 GLM Coding Plan 价格调整函,调整内容包括:取消首购优惠,保留按季按年订阅优惠;套餐价格提价 30%或以上等。根据公司披露,因市场需求增长,用户规模与调用量提升等因素,公司基于实际使用情况与资源投入变化所做的综合决定。我们认为这一涨价预示着优秀的大模型企业不缺需求,有望推动算力硬件的需求持续增长。
风险警示:
市场有风险,投资需谨慎。上海汇正财经顾问有限公司是证监会批准的证券投资咨询公司, 组织机构代码统一信用码为91310107MA1G0KQW5N,本公司是具有证券投资咨询资格证书,是合法的证券咨询平台。本文仅为投资者教育使用,不构成任何投资建议,投资者据此操作,风险自担。力求本文所涉信息准确可靠,但并不对其准确性、完整性和及时性做出任何保证,对投资者据此进行投资所造成的一切损失不承担任何责任。