以昇腾910B为例,尽管采用的是中芯国际的14nm工艺,但通过架构优化与集群互联技术,其在AI训练场景中的实际表现已接近英伟达A100。而在特定推理任务中,结合MindSpore框架与模型压缩技术,华为方案的能效比和吞吐量甚至实现反超。张平安指出:“我们衡量的不是单芯片的峰值算力,而是端到端的业务算力效率。在真实业务负载下,我们的系统能效是英伟达的3倍。”

这一优势的背后,是华为对“算力本质”的重新定义。不同于传统依赖制程红利的思路,华为更注重“系统级效能”——即在给定功耗、成本和部署环境下,实现最大化的有效算力输出。例如,在智能驾驶、智慧城市、大模型推理等场景中,华为通过边缘-云端协同调度、模型轻量化部署和低延迟通信协议,显著提升了整体系统响应速度与稳定性。