面向边缘端大模型推理的高能效异构SoC芯片研发

联系合作
高端仪器设备和工业母机
集成电路
技术领域:新能源和节能环保
榜单金额:面议
合作方式:合作开发
发布日期:20241231
截止日期:-
需求发布单位: 南京市智凌芯科技股份有限公司
关键词: 边缘端  大模型推理  模型压缩  LPU架构  RISC-V  FPGA  异构SoC  存内计算 

需求的背景和应用场景

在当今数字化转型的浪潮中,边缘端大模型推理作为人工智能技术的重要分支,正逐渐成为推动物联网、智能设备以及新能源和节能环保等领域发展的关键力量。然而,边缘端设备受限于计算能力、能耗以及资源有限等痛点,难以高效运行复杂的大模型推理任务。特别是在新能源和节能环保场景下,如智能电网管理、环境监测与预警系统等,对实时性和能效有着极高的要求。为了解决这些问题,本研究提出了面向边缘端大模型推理的高能效异构SoC(System on Chip)芯片研发需求。通过集成RISC-V通用处理器、FPGA(Field-Programmable Gate Array)以及专门设计的大模型推理加速器LPU(Large Model Processing Unit),旨在构建一个高效、灵活且低能耗的边缘计算平台,以满足新能源和节能环保领域对智能化、实时性和能效的迫切需求。

要解决的关键技术问题

  1. 边缘端大模型压缩工具设计:针对边缘端资源受限的特点,研发高效的大模型压缩技术,包括模型裁剪、量化以及知识蒸馏等,以减小模型体积和计算复杂度,同时保持模型的精度和泛化能力。
  2. 边缘端大模型推理加速器LPU架构设计:设计针对大模型推理特点的专用加速器LPU,优化数据流动和计算效率,支持高效的矩阵运算、卷积操作等核心算法,实现低延迟、高吞吐量的推理性能。
  3. 面向边缘端大模型的RISC-V+FPGA异构SoC系统设计:构建一个高度集成的异构SoC系统,结合RISC-V处理器的灵活性和FPGA的可编程性,实现计算资源的动态配置和优化调度,以满足不同应用场景下的性能需求。
  4. 针对边缘端大模型推理场景的存内计算软硬件协同设计:探索存内计算(In-Memory Computing)技术在边缘端大模型推理中的应用,通过软硬件协同设计,减少数据搬移,提高计算效率,进一步降低能耗。

效果要求

本项目预期成果将显著提升边缘端大模型推理的能效比,实现以下几个方面的效果:

  • 高效能:通过优化的模型压缩工具和专用的LPU加速器,显著提高推理速度,降低延迟,满足实时性要求。
  • 低能耗:结合RISC-V+FPGA的异构设计和存内计算技术,有效减少能耗,延长边缘设备的续航能力。
  • 灵活性:RISC-V处理器的引入使得系统具有更高的灵活性和可扩展性,易于适应不同的应用场景和算法更新。
  • 创新性:本项目在边缘端大模型推理领域引入了创新的异构SoC芯片设计,为新能源和节能环保等领域的智能化转型提供了强有力的技术支撑,具有显著的创新性和竞争优势。

根据边缘端大模型推理的流程和特点,将其划分为大模型优化,异构SoC系统支持和存内计算优化等4个子课题分别进行攻关。这些子课题聚焦大模型推理的关键步骤,同时课题之间还有密切的联系。本研究最终形成一个由RISC-V通用处理器+FPGA+大模型推理加速器LPU组成的的异构SoC芯片,对边缘端大模型推理进行端对端加速优化,提升整体能效。具体的研发内容和关键技术问题如下:①边缘端大模型压缩工具设计;②边缘端大模型推理加速器LPU架构设计;③面向边缘端大模型的RISC-V+FPGA异构SoC系统设计;④针对边缘端大模型推理场景的存内计算软硬件协同设计。

试试对话AI技术经理人
WENJINGZHUAN
问小果
目前哪些机构有相似的技术需求?
该需求的技术路线?
为该需求推荐相关的科技成果?
哪些机构或团队可能解决该技术需求?