芯原超低能耗NPU可为移动端大语言模型推理提供超40 TOPS算力

2025-06-09 10:23
二维码

202569日,中国上海——芯原股份(芯原,股票代码:688521.SH今日宣布其超低且高性能的神经网络处理器(NPUIP支持在移动端进行大语言模型(LLM)推理,AI算力可扩展至40 TOPS以上。该高能效NPU架构专为满足移动平台日益增长的生成式AI需求而设计,不仅能够AI PC等终端设备提供强劲算力支持,而且能够应对智慧手机等移动终端对低能耗更为严苛挑战。


芯原的超低NPU IP具备高度可配置、可扩展的架构,支持混合精度计算、稀疏优化和并行处理。其设计融合了高效的内存管理与稀疏感知加速技术,显著降低计算负载与延迟,确保AI处理流畅、响应迅速。该NPU支持数百种AI算法,AI降噪(AI-NRAI超分(AI-SR)等,并兼容Stable DiffusionLLaMA-7B等主流AI模型。同时,该NPU IP与芯原其他处理器IP无缝集成,实现异构计算,助力SoC设计者打造满足多元化应用需求AI解决方案。


此外,芯原的超低NPU IP还支持TensorFlow LiteONNXPyTorch等主流AI框架,可加速客户在不同AI应用场景中的部署进程并简化集成工作。


“智能手机等移动设备正逐步演变为个人AI服务器。随着生成式AIAIGC)和多模态大语言模型技术的快速发展,市场对AI算力需求呈指数级增长,并已成为移动产品的关键差异化要素。”芯原首席战略官、执行副总裁、IP事业部总经理戴伟进表示,“支持高强度AI计算负载的过程中,耗控制是关键的挑战之一。芯原持续深耕面向智慧手机AI PC的超低NPU研发,并通过与主流SoC合作伙伴的紧密协作,见证了该技术在一代智慧手机和AI PC中实现量产。”


###


关于芯原

芯原微电子(上海)股份有限公司(芯原股份688521.SH)是一家依托自主半导体IP,为客户提供平台化、全方位、一站式芯片定制服务和半导体IP授权服务的企业。

公司拥有自主可控的图形处理器IPGPU IP)、神经网络处理器IPNPU IP)、视频处理器IPVPU IP)、数字信号处理器IPDSP IP)、图像信号处理器IPISP IP)和显示处理器IPDisplay Processing IP)这六类处理器IP,以及1,600多个数模混合IP和射频IP

基于自有的IP,公司已拥有丰富的面向人工智能(AI)应用的软硬件芯片定制平台解决方案,涵盖如智能手表、AR/VR眼镜等始终在线(Always-on)的轻量化空间计算设备,AI PCAI手机、智慧汽车、机器人等高效率端侧计算设备,以及数据中心/服务器等高性能云侧计算设备。

为顺应大算力需求所推动的SoC(系统级芯片)向SiP(系统级封装)发展的趋势,芯原正在IP芯片化(IP as a Chiplet芯片平台化(Chiplet as a Platform平台生态化(Platform as an Ecosystem理念为行动指导方针,从接口IPChiplet芯片架构、先进封装技术、面向AIGC和智慧出行的解决方案等方面入手,持续推进公司Chiplet技术、项目的研发和产业化。

基于公司独有的芯片设计平台即服务(Silicon Platform as a Service, SiPaaS)经营模式,目前公司主营业务的应用领域广泛包括消费电子、汽车电子、计算机及周边、工业、数据处理、物联网等,主要客户包括芯片设计公司、IDM、系统厂商、大型互联网公司、云服务提供商等。

芯原成立2001年,总部位于中国上海,在全球设有8个设计研发中心,以及11个销售和客户支持办事处,目前员工已超过2,000人。

昵称:
内容:
验证码:
提交评论
评论一下