在大模型研发和产业应用中,存在大模型训练和推理基础支撑能力不足、多后端国产硬件支持不完善、长序列数据处理困难、低精度训练和量化感知训练效率低、大模型高效压缩和推理技术缺乏、软件质量保障手段不足、开源社区生态发展缺乏有效度量方法等痛点问题。
20251208
信息传输、软件和信息技术服务业
国产化人工智能创新联合体
北京市科学技术委员会;中关村科技园区管理委员会
课题科技成果主要是国产深度学习框架飞桨3.0和相关关键技术方案的代码实现。 (1)飞桨深度学习框架3.0的代码。包括面向大模型的新一代深度学习框架基础架构实现代码,以新的深度学习中间表示PIR为核心,神经网络编译器和高效执行引擎为支撑,支持动静统一的自动并行,以及高鲁棒性的大规模集群训练等,全面提升了大模型训推基础支撑能力。 (2)基于飞桨的大模型训练、压缩、推理全流程的关键技术实现代码。包括面向多后端国产硬件支持的分布式集合通信库、面向长序列数据的灵活自适应的分布式并行技术方案、高效深度学习低精度训练加速及量化感知训练技术方案、面向大模型研发和产业应用的高效压缩和推理技术方案等代码实现,进一步完善了飞桨训压推全流程技术。 (3)基于飞桨的大模型套件关键技术方案代码。包括有限显存条件的超长序列预训练建模技术、自适应低资源精调算法及高效领域任务预训练方法,并基于该方案研制了面向医疗、金融和计算机学科的三个百亿级垂直领域大模型;基于飞桨研发了基于大模型的向量检索应用技术,构建了端到端高性能语义检索系统。有力推动了国产化人工智能技术方案应用落地,取得显著成效。 (4)研究了可信深度学习框架软件质量保障技术,形成一套可信深度学习框架软件研发及质量分析和检测工具,在飞桨新版本上发现并自动修复其中107条软件缺陷,并输出可信深度学习框架软件质量评估报告;研究了数据驱动的大型深度学习框架软件研发项目度量方法,产出度量飞桨深度学习框架软件开发实践中程序员能力、项目群体协同、社区生态的指标和方法,并实现集成的开源软件度量平台,输出飞桨生态度量报告。为飞桨软件质量提升和开源社区生态发展提供有力支撑。
