在人工智能向终端加速发展的背景下,安谋科技于11月13日在上海发布了其首款面向AI时代的IP产品——“周易”X3 NPU。这款产品标志着安谋科技在“AI in All”战略上迈出了关键一步,旨在将AIGC算力提升10倍,解决端侧大模型应用的难题,为智能手机、AIPC和智能汽车等设备提供更强大的AI支持。
随着生成式AI(GenAI)从

云端向终端迁移,用户对本地化文生图、语音交互、智能助手等AIGC应用的需求激增。然而,终端设备受限于功耗、散热与成本,难以承载大模型所需的庞大算力。“周易”X3应运而生,旨在解决这一难题。它采用专为Transformer架构优化的DSP+DSA混合架构,不仅能高效处理CNN与大模型的计算需求,还全面支持FP16、FP8等浮点运算,适应AI从传统定点计算向高精度浮点演进的趋势,为终端设备提供强大而高效的AI算力支持。

最引人注目的是其性能跃升:相较于上一代产品,“周易”X3在AIGC任务上的算力实现高达10倍增长。这一突破源于三大核心升级——16倍提升的FP16 TFLOPS算力、4倍增强的计算核心带宽,以及对Softmax、LayerNorm等大模型关键算子超过10倍的性能优化。在Llama2-7B模型实测中,其Prefill阶段算力利用率高达72%,远超行业平均水平。
更令人称道的是其“有效带宽利用率超100%”的Decode表现。这背后是安谋科技自研的无损解压硬件WDC,通过实时解压压缩权重,等效提升带宽15%~20%,让有限物理资源发挥更大效能。同时,支持W4A8/W4A16低比特量化与多精度融合计算,使模型部署更高效、能效更优。
为降低开发门槛,“周易”X3配套推出“CompassAI”软件平台,支持PyTorch、ONNX等主流框架,并可一键部署HuggingFace模型。平台已开源Parser、Optimizer等核心组件,助力开发者实现“白盒”调优,快速落地AI应用。