在当今数字化转型的浪潮中,边缘端大模型推理作为人工智能技术的重要分支,正逐渐成为推动物联网、智能设备以及新能源和节能环保等领域发展的关键力量。然而,边缘端设备受限于计算能力、能耗以及资源有限等痛点,难以高效运行复杂的大模型推理任务。特别是在新能源和节能环保场景下,如智能电网管理、环境监测与预警系统等,对实时性和能效有着极高的要求。为了解决这些问题,本研究提出了面向边缘端大模型推理的高能效异构SoC(System on Chip)芯片研发需求。通过集成RISC-V通用处理器、FPGA(Field-Programmable Gate Array)以及专门设计的大模型推理加速器LPU(Large Model Processing Unit),旨在构建一个高效、灵活且低能耗的边缘计算平台,以满足新能源和节能环保领域对智能化、实时性和能效的迫切需求。
本项目预期成果将显著提升边缘端大模型推理的能效比,实现以下几个方面的效果:
根据边缘端大模型推理的流程和特点,将其划分为大模型优化,异构SoC系统支持和存内计算优化等4个子课题分别进行攻关。这些子课题聚焦大模型推理的关键步骤,同时课题之间还有密切的联系。本研究最终形成一个由RISC-V通用处理器+FPGA+大模型推理加速器LPU组成的的异构SoC芯片,对边缘端大模型推理进行端对端加速优化,提升整体能效。具体的研发内容和关键技术问题如下:①边缘端大模型压缩工具设计;②边缘端大模型推理加速器LPU架构设计;③面向边缘端大模型的RISC-V+FPGA异构SoC系统设计;④针对边缘端大模型推理场景的存内计算软硬件协同设计。
